GAUSS™ 23 新機能
GAUSS23ではデータ探索・データインポート・モデル作成において
業務効率化を可能にする便利な新機能が搭載されました。
すぐに利用可能なデータ
- FREDやDBnomicsのデータベースと連携することで、何百万の国際的な経済・金融データにアクセス可能
- インポート中にFREDデータの集約・フィルター・並べ替え・変換が可能
- GAUSSからFREDデータを検索可能
インターネット上のどこからでもデータを読み込み可能
//aptech Web サイトから Excel ファイルを読み込むfile_url = "http://www.aptech.com/wp-content/uploads/2019/03/skincancer2.xlsx";skin_cancer =(file_url);// データフレームの最初の5行を出力します。(skin_cancer);
State Lat Mort Ocean Long Alabama 33 219 1 87 Arizona 34.5 160 0 112 Arkansas 35 170 0 92.5 California 37.5 182 1 119.5 Colorado 39 149 0 105.5
シンプルなデータ読み込み
自動データ型検出
以前のバージョン
- ファイルから日付・文字列・カテゴリ変数を指定するためにキーワードを含む数字式文字列が必要
GAUSS 23
- 変数の型を判断するスマートなデータ型検出により、約 40 の一般的な日付形式を自動的に検出
ヘッダーと区切り文字の自動検出
load X[127,4] = mydata.txt;
と
X = "mydata.txt");
(
load X[127,4] = mydata.txt;
と
X = "mydata.txt");
(
下記項目を自動処理
- ヘッダー行の有無
- タブ・コンマ・セミコロン・空白などの区切り
- 行数と列数
- 変数の型
最上のデータストレージ
- loadd・saved・.gdatファイル拡張子を使用してデータフレームの読み込みと保存をすることで、新しいコードは習得不要
拡張された分位点回帰
hitters = "islr_hitters.xlsx"); tau = 0.90;(call (hitters, "ln(salary) ~ AtBat + Hits + HmRun", tau);
Linear quantile regression =============================================================================== Valid cases: 263 Dependent variable: ln_salary_ Missing cases: 0 Deletion method: None Number variables: 3 DF model 3 DF residuals 259
=============================================================================== Name Coeff. Standard t-value P >|t| lb ub Error
------------------------------------------------------------------------------- Tau = 0.90
CONSTANT 6.285 0.194 32.433 0.0000 5.905 6.664 AtBat -0.001 0.002 -0.737 0.4621 -0.004 0.002 Hits 0.008 0.005 1.526 0.1281 -0.002 0.018 HmRun 0.017 0.009 1.951 0.0521 -0.000 0.034
- 新しいカーネル推定分散共分散行列
- 最大4倍まで処理速度アップ
- 疑似R2乗・係数t統計量・p値・自由度を含む拡張されたモデル診断
カーネル密度推定
- 使用可能な13のカーネル関数によって未知の確率密度関数を推定
- 自動またはユーザー指定のバンド幅
- カスタマイズの為の使いやすいオプションを備えたカーネル密度プロット
改善された共分散の計算
// データを読み込みfname = "examples/auto2.dta");(auto =(fname);// 制御構造を宣言するstruct olsmtControl ctl;ctl =();// 残差をONにするctl.res = 1;// HACエラーをONにするctl.cov = "hac";call (auto, "mpg ~ weight + foreign", ctl);
Valid cases: 74 Dependent variable: mpg Missing cases: 0 Deletion method: None Total SS: 2443.459 Degrees of freedom: 71 R-squared: 0.663 Rbar-squared: 0.653 Residual SS: 824.172 Std error of est: 3.407 F(2,71): 69.748 Probability of F: 0.000 Durbin-Watson: 2.421 Std Prob Std Cor with Variable Estimate Error t-value >|t| Est Dep Var ------------------------------------------------------------------------------- CONSTANT 41.6797 1.8989 21.95 0.000 --- --- weight -0.00659 0.0006 -11.99 0.000 -0.885 -0.807175 foreign: Foreign -1.65003 0.9071 -1.819 0.073 -0.131 0.393397 Note: HAC robust standard errors reported
- Newy-West HACロバスト標準誤差を計算するための新しい手法
- 全てのロバストな共分散手順に、小さい標本の修正をオフにするオプションを含む
- データフレームと数式文字列の互換性の拡張
データクレンジングと探索の為の新機能
between
//観測値がリストの期間内にある場合は1を返すmatch = "DATE"], "2020-03", "2020-08");(unemp[.,//一致する観測値を選択するunemp =(unemp, match);
DATE UNRATE 2020-03-01 4.4000 2020-04-01 14.700 2020-05-01 13.200 2020-06-01 11.000 2020-07-01 10.200 2020-08-01 8.4000
- 指定範囲内の観測値を示すバイナリ ベクトルを返却
- selifの併用により行を選択可能
- 日付と序数のカテゴリ列をサポート
where
// 毎日のホテルの部屋料金hotel_price = {, , , , };// 毎日の気温予報temperature = {, , , , };// 100 ℉以上気温がある日は料金が1割引きになります。new_price =(temperature .> ,hotel_price .*,hotel_price);
new_price = 238 405 364.50 296.10 238
- データの結合、修正のための便利で直感的な手法を提供
- 条件に応じてaまたはbから要素を返却
- 歪度関数と尖度関数により、標本の対称性と裾を調査
- 新しいJarqueBera関数を使用して正規性をテスト可能
処理速度と効率性の改善
- shiftc・lagn
- 速度:最大10倍
- メモリ使用量:50%減少
- miss・missrv
- 速度:最大2倍 (大きなデータの場合はそれ以上)
- メモリ使用量:50%減少
- 算術演算子(+・-・.*・./)・比例演算子(.>・.<・.>=・.<=・.==・.!=)・論理演算子(.and・.not・.or・.xor)
- 速度:最大2倍 (大きなデータの場合はそれ以上)
- メモリ使用量:50%減少
- indsav1
- 速度:最大100倍
- reclassify
- 速度:最大40%上昇
- loadd とデータのインポートウィンドウを使用してエクセルファイルを読み込む場合
- 速度:最大3倍
その他バグの修正
全ての変更点は開発元の以下のページ(英語)をご参照ください。
GAUSS™ v23 システム要件
OS
- Windows 64-bit: Windows 10 / 11
- Windows Server 64-bit: 2012以降
- macOS 64-bit: macOS 10.13以降
- Linux 64-bit: Red Hat 7.X+ / CentOS / Ubuntu
※Windows RT、Windows 10/11(Sモード)、ARM版Windows 10/11は対象外です。
※Appleシリコン(M1チップなど)搭載macOSへのネイティブ対応を予定していますが時期は未定です。
それまでの暫定対処としてRosetta 2を介して使用しているユーザーがいます。
ハードウェア
- ストレージ: 最小500MB
- RAM: 最小1GB / 4GB以上を推奨