Stata 15の新機能
Stata15の販売は終了しております。
先進の手法を多数実装!
近年の統計学の成果をいち早く取り入れ、Stataは大幅な進化を遂げました。
「空間自己回帰モデル」「線形DSGEモデル」など最新手法が搭載され、内生性を扱う「拡張回帰モデル」や「有限混合モデル」「潜在クラス分析」「ベイズ分析」など既存機能との融合が進んだことで、高度な次元の解析が実現可能になりました。
Stata15で注目の機能のいくつかを以下で紹介します。
有限混合モデル
新たなプレフィックスコマンドfmm:は17種の推定コマンドと共に用いて有限混合分布モデルを推定できます。連続、二値、順序、カウント、カテゴリカル、さらに生存の各アウトカムに対する回帰モデルの有限混合分布でのフィットを実施できます。
fmm:の典型的な利用例は、一つのモデル内に非観測な部分母集団が複数存在し、パラメータ(係数、ロケーション、分散、尺度等)が部分母集団ごとに異なる値をとることを許可した上でフィットするという推定例です。非観測な部分母集団は、LCAの場合と同様に「クラス」と呼ばれます。一例として、3つのクラスの混在が想定される線形回帰モデルでのパラメータ推定の場合を考えます。クラスメンバーシップ(各観測のクラスへの帰属)に関する情報がなくても、次のコマンドでフィットができます。
. fmm 3: regress y x1 x2
推定結果には各クラスの回帰係数と定数に加え、クラスメンバーシップを予測するモデルが表示されます。
同様に、二値アウトカムに対してはfmm: logit、生存アウトカムに対してはfmm: stregが使用できます。また、fmm:は複数の推定コマンドと共に用いて、クラスごとに従うモデルが異なる場合にも対処できます。fmm: (regress y x1 x2) (poisson y x1 x2 x3)を実行すると、線形回帰モデルに従うクラスが一つ、およびポアソン回帰モデルに従うクラスが一つとしたフィットを行えます。
推定後コマンドでは、1) 各クラスの全体に占める割合の推定、2) クラス内のアウトカム周辺平均の予測、3) クラスメンバーシップ確率と予測アウトカムの確率の予測、を行うことができます。
空間自己回帰 (SAR) モデル
空間自己回帰 (spatial autoregressive:SAR) モデルを新たにサポートしました。SAR モデルでは被説明変数の空間ラグ、説明変数の空間ラグ、そして、空間自己回帰誤差を利用できます。空間ラグとは一般的に、時系列データで利用するラグの空間版を意味しています。時系列におけるラグが過去のデータを意味するのに対して空間モデルでのラグは隣接する地域のデータを指します。
SARモデルの推定用にspregress, 内生変数に対応したspivregress, そしてパネルデータに対するspxtregressコマンドを新たに用意しました。空間自己回帰モデルでは地域のデータを利用します。データは国、州、地方、郡、市、郵便番号、都市区分などが単位の情報となります。しかし、地理的な情報に限定される訳ではありません。例えば、ソーシャルネットワークのノード単位のものでもかまいません。空間モデルでは隣接する地域からの直接効果だけでなく、それらの地域からの波及効果も推定できます。
新たに空間モデル用のコマンドセットと、新しいマニュアル[SP]を用意しました。データが地理的情報に対応している場合、地図を定義するための標準的な形式のシェープファイルをウェブサイトからダウンロードできます。単一コマンドの場合、地域からの距離の逆数に比例する波及効果を求めたり、近隣地域からの限定的効果を求めることができます。また、近隣地域の定義を独自に作成することも可能です。
線形DSGEモデル
経済学やファイナンスの領域で利用されている時系列モデルである線形DSGEモデルは伝統的な予測モデルに対する、もう一つの大きなモデリング手法です。DSGEモデルはミクロ経済学の理論をそのモデリングにおいて利用します。複数の推定式には現在の変数に影響を与える、将来の期待変数が含まれます。この点がまさにVARモデルや状態空間モデルと異なる点です。さらに、モデルが経済理論に基づいているため、パラメータを経済理論の観点から解釈できます。
伝統的な予測モデルとされるマクロ計量モデルと今回サポートしたDSGEモデルはどちらも、集約したマクロ変数による経済現象をモデル化するものです。しかし、DSGEモデルはミクロ経済学の理論をそのモデリングにおいて利用します。
DSGEモデルはミクロ経済学の理論を利用するということから、複数の推定式を利用することになります。それらの推定には現在の変数に影響を与える、将来の期待変数が含まれます。この点がまさにVARモデルや状態空間モデルと異なる点です。さらに、モデルが経済理論に基づいているため、パラメータを経済理論の観点から解釈できます。
DSGEモデルの推定後、estat policyやestat transitionコマンドで政策および遷移行列を推定できます。既存のforecastコマンドとirfコマンドにより予測値の計算と、インパルス応答のグラフを作成できます。
拡張回帰モデル
Stataが独自にネーミングするERM(拡張回帰モデル)は、これまで個別でしか扱えなかった次の問題を扱うことができます。
- 内生共変量
- 非ランダムな処置割り付け
- ヘックマン型の内生性サンプルセレクション
上記が個別に存在する状況は既存のheckmanとivregressで対応できますが、ERMでは問題が複数存在する状況にも対処できます。またERMは非線形モデルにも対応しています。ERMコマンドとして、次の4つが提供されます。
- eregress :連続アウトカムに対する線形モデルのフィット
- eintreg :測定値を階級で表現したアウトカムや打ち切りのあるアウトカムに対する区間回帰モデル(tobitなど)のフィット
- eprobit :二値アウトカムに対するprobit回帰モデルのフィット
- eoprobit :順序アウトカムに対するprobit回帰モデルのフィット
上記の新機能のいずれかを利用して、これまでモデルフィットできなかった次のような分析が可能になりました。
- 内生共変量を伴う区間回帰
- 内生性のある二値アウトカムを伴うprobit回帰
- 内生性のある順序アウトカムを伴うprobit回帰
- 内生性のある処置を伴う順序probit回帰
- tobit内生サンプルセレクションを伴う線形回帰
潜在クラス分析 (LCA)
潜在クラス分析がgsemで行えるようになりました。潜在クラス分析では、潜在的なカテゴリ変数を用いて分析を行います。カテゴリカル変数で指示されるクラスは通常観測されることはありません。潜在クラスによる分類例として次のようなものが考えられます。
- マーケティングや経営分野で嗜好に基づいた客層の分類を行う
- 医療分野でリスクに基づいた患者のグループ分けを行う
- 教育や心理学分野で行動パターンに基づいた生徒の分類を行う
bayesプレフィックス
bayesプレフィックスが45種の既存の推定コマンドでサポートされ、ベイズ回帰をより簡単に行えるようになりました。たとえば線形回帰ならば、既存のbayesmhを用いた手順のほかに、次の簡便なコマンドを用いた方法でフィットが行えます。
. bayes: regress y x1 x2
また、ベイズ分析によるマルチレベルモデルも新たにサポートされ、bayes: mixedによるフィットが行えます。
区間打ち切りのある生存時間モデル
イベントの生起が不明な中間期間を打ち切りとして考慮するモデルで生存時間分析を行うことができます。この区間打ち切りモデルは、イベント生起の正確な時刻が分からないときに使用できます。新たなコマンドstintregによりstregと同様の手順で分析が可能です。
混合ロジットモデル:選択肢のモデリング
選択肢をアウトカムとする条件付きロジットや順序プロビットモデルにランダム係数を投入して分析することができます。IIA(independence from irelevant alternatives)の前提が満たされず選択肢間に相関がある場合でも、ランダム係数を用いて選択肢間の相関をモデルに組み込んだ分析ができます。
非線形マルチレベル混合効果モデル
menlをサポートし、非線形混合効果モデルあるいは非線形階層モデルと呼ばれる手法が可能になりました。既存のmixedまたはnlどちらの拡張とも捉えることのできる新たなコマンドmenlは、固定効果やランダム効果を含む非線形な推定式を入力して係数推定を行うことができます。
FREDのインポート
FRED(米連邦準備銀行経済データ)をStataからブラウズしてインポートする機能が追加されました。日本など世界各国の経済データを含む総数48万件以上のFREDは、St. Louis Federal Reserve(セントルイス連邦準備銀行)が登録を条件に自由にダウンロードできる形で提供を行っています。Stata 15ではFREDをキーワードなどで検索し、取得したい時系列データを直接Stataにインポートできます。
Word®文書やPDF文書の作成
StataによるWord®文書やPDF文書がExcel®表と同様に簡単に作成できます。doファイルを用いて最新の分析結果、図表を含んだWord文書およびPDF文書を一度に作成することができます。レポートの作成を自動化することもできます。
Stata 14で親しまれたputexcelに、新たにputdocxおよびputpdfが加わりました。新たなコマンドは丁度putexcelと同様に動作します。doファイルを用いて最新の分析結果、図表を含んだWord文書およびPDF文書を一度に作成することができます。レポートの作成を自動化することもできます。
新たなコマンドputdocxは、段落、画像、表の書き込みをWord文書(より正確にはOffice Open XML(.docx)ファイル)に対して行います。putpdfと同様、画像にはStataのグラフを含めることが可能で、オブジェクトのフォーマット変更も行えます。
新たなコマンドputpdfは、段落、画像、表の書き込みをPDF文書に対して行います。画像にはStataのグラフや所属団体のロゴを含めることが可能です。太字、斜体、フォントサイズ、カスタム表など、オブジェクトのフォーマット変更も行えます。
Stata 15 動作環境
プラットフォーム互換性
Stata はWindows, Macintosh, Linux上で利用することができます。Stata のデータセット、プログラム、及びその他のデータはこれらのプラットフォーム間で共用することができます(変換は必要ありません)。
また他の統計パッケージ、スプレッドシート、データベースからデータセットをインポートする機能も用意されています。
対応OS (1枚のDVDで下記の全てのOSに対応しています。)
Stata for Windows |
Windows 10 |
Stata for Mac |
macOS 10.9 以上が動作している 64bit Intelプロセッサ(Core™2 Duo 以上)搭載の Mac |
Stata for Linux |
Linux(64bit) |
最小メモリ・ディスク容量
種類 | メモリ | ディスク容量 |
---|---|---|
Stata/MP | 4 GB | 1 GB |
Stata/SE | 2 GB | 1 GB |
Stata/IC | 1 GB | 1 GB |
その他の最小動作環境
- DVD版の場合は DVD-ROM ドライブ必須
(DVD-ROMドライブが無いPCへインストールしたい場合はダウンロード版をご購入ください。) - Stata for Unix では 1000 色以上(16bit または 24bit カラーなど)出力ができるビデオカード必須
インストール可能台数
シングルライセンスのStataは3台のPCにインストール可能です。ただし、これは1人のユーザが自宅、職場、持ち運び用のノートPCにStataをインストールし、同時に利用しない場合に限ります。
※1台を複数人で供用したり、3台のPCにインストールしてそれぞれを別の人が利用するような使用方法は使用許諾書で禁止されています。
ご利用形態に応じたライセンスの種類ついての詳細はこちら
旧バージョンとのファイルのやり取りについて
- 読み込み: Stata15はStata14やそれ以前のファイルを読み込み可能です。
※ただし、Stata13またはそれ以前で保存されたファイルに日本語などの拡張ASCII文字が含まれる場合、変換が必要になることがございます。
詳細はこちらの資料をご覧下さい。 - 保存: Stata15は旧バージョンであるStata14と同じ形式でデータセットを保存します。また、Stata13や12、11それぞれの形式でのファイル保存も可能です。
※それ以前のバージョンのファイル保存形式はサポートしていませんが、テキストファイル経由でご利用可能です。