GAUSS™ 23 新機能

GAUSS23ではデータ探索・データインポート・モデル作成において
業務効率化を可能にする便利な新機能が搭載されました。

すぐに利用可能なデータ

インテリジェントなグラフ属性 インテリジェントなグラフ属性
  • FREDやDBnomicsのデータベースと連携することで、何百万の国際的な経済・金融データにアクセス可能
  • インポート中にFREDデータの集約・フィルター・並べ替え・変換が可能
  • GAUSSからFREDデータを検索可能

インターネット上のどこからでもデータを読み込み可能

//aptech Web サイトから Excel ファイルを読み込む
file_url = "http://www.aptech.com/wp-content/uploads/2019/03/skincancer2.xlsx";
skin_cancer = loadd(file_url);
// データフレームの最初の5行を出力します。
head(skin_cancer);
       State       Lat       Mort      Ocean        Long
     Alabama        33        219          1          87
     Arizona      34.5        160          0         112
    Arkansas        35        170          0        92.5
  California      37.5        182          1       119.5
    Colorado        39        149          0       105.5

シンプルなデータ読み込み

自動データ型検出

以前のバージョン

以前のバージョンの主導の検出 以前のバージョンの主導の検出
  • ファイルから日付・文字列・カテゴリ変数を指定するためにキーワードを含む数字式文字列が必要

GAUSS 23

自動データ型検出 自動データ型検出
  • 変数の型を判断するスマートなデータ型検出により、約 40 の一般的な日付形式を自動的に検出

ヘッダーと区切り文字の自動検出

load X[127,4] = mydata.txt;

X = loadd("mydata.txt");
load X[127,4] = mydata.txt;

X = loadd("mydata.txt");

下記項目を自動処理

  • ヘッダー行の有無
  • タブ・コンマ・セミコロン・空白などの区切り
  • 行数と列数
  • 変数の型

最上のデータストレージ

データストレージ データストレージ
  • loadd・saved・.gdatファイル拡張子を使用してデータフレームの読み込みと保存をすることで、新しいコードは習得不要

拡張された分位点回帰

拡張された分位点回帰 拡張された分位点回帰
hitters = loadd("islr_hitters.xlsx");

tau = 0.90;

call quantileFit(hitters, "ln(salary) ~ AtBat + Hits + HmRun", tau);
Linear quantile regression

===============================================================================
Valid cases:                 263            Dependent variable:     ln_salary_
Missing cases:                 0               Deletion method:           None
Number variables:              3                       DF model              3
DF residuals                 259
=============================================================================== Name Coeff. Standard t-value P >|t| lb ub Error
------------------------------------------------------------------------------- Tau = 0.90
CONSTANT 6.285 0.194 32.433 0.0000 5.905 6.664 AtBat -0.001 0.002 -0.737 0.4621 -0.004 0.002 Hits 0.008 0.005 1.526 0.1281 -0.002 0.018 HmRun 0.017 0.009 1.951 0.0521 -0.000 0.034
  • 新しいカーネル推定分散共分散行列
  • 最大4倍まで処理速度アップ
  • 疑似R2乗・係数t統計量・p値・自由度を含む拡張されたモデル診断

カーネル密度推定

カーネル密度推定 カーネル密度推定
  • 使用可能な13のカーネル関数によって未知の確率密度関数を推定
  • 自動またはユーザー指定のバンド幅
  • カスタマイズの為の使いやすいオプションを備えたカーネル密度プロット

改善された共分散の計算

// データを読み込み
fname = getGAUSShome("examples/auto2.dta");
auto = loadd(fname);
// 制御構造を宣言する
struct olsmtControl ctl;
ctl = olsmtControlCreate();
// 残差をONにする
ctl.res = 1;
// HACエラーをONにする
ctl.cov = "hac";
call olsmt(auto, "mpg ~ weight + foreign", ctl);
Valid cases:                    74      Dependent variable:                 mpg
Missing cases:                   0      Deletion method:                   None
Total SS:                 2443.459      Degrees of freedom:                  71
R-squared:                   0.663      Rbar-squared:                     0.653
Residual SS:               824.172      Std error of est:                 3.407
F(2,71):                    69.748      Probability of F:                 0.000
Durbin-Watson:               2.421

                                  Std                 Prob      Std    Cor with
Variable            Estimate     Error     t-value    >|t|      Est    Dep Var
-------------------------------------------------------------------------------

CONSTANT             41.6797    1.8989     21.95     0.000      ---         ---
weight              -0.00659    0.0006    -11.99     0.000   -0.885   -0.807175
foreign: Foreign    -1.65003    0.9071    -1.819     0.073   -0.131    0.393397

Note: HAC robust standard errors reported
  • Newy-West HACロバスト標準誤差を計算するための新しい手法
  • 全てのロバストな共分散手順に、小さい標本の修正をオフにするオプションを含む
  • データフレームと数式文字列の互換性の拡張

データクレンジングと探索の為の新機能

between

//観測値がリストの期間内にある場合は1を返す
match = between(unemp[.,"DATE"], "2020-03", "2020-08");
//一致する観測値を選択する
unemp = selif(unemp, match);
            DATE        UNRATE
      2020-03-01        4.4000
      2020-04-01        14.700
      2020-05-01        13.200
      2020-06-01        11.000
      2020-07-01        10.200
      2020-08-01        8.4000
  • 指定範囲内の観測値を示すバイナリ ベクトルを返却
  • selifの併用により行を選択可能
  • 日付と序数のカテゴリ列をサポート

where

// 毎日のホテルの部屋料金
hotel_price = { 238, 405, 405, 329, 238 };
// 毎日の気温予報
temperature = { 89, 94, 110, 103, 97 };
// 100 ℉以上気温がある日は料金が1割引きになります。
new_price = where(temperature .> 100,
hotel_price .* 0.9,
hotel_price);
new_price = 238 405 364.50 296.10 238
  • データの結合、修正のための便利で直感的な手法を提供
  • 条件に応じてaまたはbから要素を返却
  • 歪度関数と尖度関数により、標本の対称性と裾を調査
  • 新しいJarqueBera関数を使用して正規性をテスト可能

処理速度と効率性の改善

  • shiftc・lagn
    • 速度:最大10倍
    • メモリ使用量:50%減少
  • miss・missrv
    • 速度:最大2倍 (大きなデータの場合はそれ以上)
    • メモリ使用量:50%減少
  • 算術演算子(+・-・.*・./)・比例演算子(.>・.<・.>=・.<=・.==・.!=)・論理演算子(.and・.not・.or・.xor)
    • 速度:最大2倍 (大きなデータの場合はそれ以上)
    • メモリ使用量:50%減少
  • indsav1
    • 速度:最大100倍
  • reclassify
    • 速度:最大40%上昇
  • loadd とデータのインポートウィンドウを使用してエクセルファイルを読み込む場合
    • 速度:最大3倍

その他バグの修正

全ての変更点は開発元の以下のページ(英語)をご参照ください。

https://docs.aptech.com/gauss/changelog.html

GAUSS™ v23 システム要件

OS

  • Windows 64-bit: Windows 10 / 11
  • Windows Server 64-bit: 2012以降
  • macOS 64-bit: macOS 10.13以降
  • Linux 64-bit: Red Hat 7.X+ / CentOS / Ubuntu

※Windows RT、Windows 10/11(Sモード)、ARM版Windows 10/11は対象外です。
※Appleシリコン(M1チップなど)搭載macOSへのネイティブ対応を予定していますが時期は未定です。
それまでの暫定対処としてRosetta 2を介して使用しているユーザーがいます。

ハードウェア

  • ストレージ: 最小500MB
  • RAM: 最小1GB / 4GB以上を推奨

過去バージョンの新機能と改善点

 

page_top_icon