GAUSS 18 - データ操作
データの読み込みと変換を簡素化する新しい数式文字列
//1ステップでデータを読み込み、変換、予測 call ols("credit.xlsx", "ln(balance) ~ ln(income) + factor(sex)"); //データを読み込み、文字列型の列 'state'を数値型のカテゴリに再分類する X = loadd("census.csv", "income + household_size + reclassify(state)");
GAUSS 18は1行でデータの読み込み、変換、分析を行えるように、 以前に統合された数式文字列の構文を拡張しました。
拡張された数式文字列の構文:
- 必要なコード行を大幅に削減
- CSV, Excel, GAUSSデータセット, HDF5, STATAとSASのデータセットを使用可能
- サポートされている自動化された変換:
- `ln`、` exp`やGAUSSプロシージャのような変換の適用
- 交互作用項の作成
- ダミー変数の作成
- 文字列変数の再分類
STATAとSASのデータセットの読み込み
//Stataのデータセットを読み込み、記述統計を計算 call dstatmt("auto2.dta", "mpg + weight + gear_ratio"); //SASのデータセットを読み込み、交互作用項を作成し、GAUSSの行列 'X'に割り当てる X = loadd("advertising.7bdat", "sales + radio * billboards + direct_mail");
GAUSSと他のソフトウェアとのデータの共有がより簡単になりました。GAUSS 18ではSTATAとSASのデータセットを読み込みできるだけでなく、STATAとSASのデータセットを、OLS、GLMや一般化モーメント法のような関数のデータソースとして直接扱うことができます。
- STATAとSASのデータセットの完全な互換性
- データ行列としてSTATAとSASのデータセットをインポート
- STATAとSASのデータセットを、OLS、GLM、GMMなどの関数の直接引数として使用
大規模なデータセットの取り扱いが向上
//連続した1 GBのブロックに大きなデータを読み込み setBlockSize("1G"); //システムメモリの10%を超えない連続したブロックに大きなデータを読み込み setBlockSize("10%");
GAUSS 18では、データ処理を制御するための新しい簡単なツールを使用して、大規模なデータセットに簡単にアクセスして分析することができます。ユーザーは次の点でデータ処理を制御できるようになりました。
- 使用可能なメモリーのパーセンテージ
- シンプルなメモリ仕様
- 行数