Stata活用ガイドブック

弊社オリジナルの活用ガイドブックです。これからStataを始める方におすすめです。

Stata活用ガイドブック

icon

サンプルデータ

Stata活用ガイドブックで使用しているサンプルデータです。活用ガイドブックと併せてご活用ください。

Stata 18 日本語マニュアル

Stata社が提供する各種マニュアルの日本語版です。

Getting Started
Windows版

icon

Getting Started
Mac版

icon

Getting Started
Unix版

icon

インストレーションガイド

icon

ユーザーズガイド

icon

分析機能例題集

Stataに搭載されているマニュアルやStataCorp LLCのウェブサイトを元に、よく使用される解析について例題を交えて解説しています。分析の考え方やコマンドの用法を理解するのに最適です。

  • Stataの対応バージョンにご注意ください。
  • ZIPファイルには、例題中のコマンド操作をまとめたdoファイルが含まれています。ZIPファイルをダウンロード後に展開(解凍)し、doファイルをStataのメニューの「ファイル > 開く」で開いて使用します。

日付と時間の新しい関数

  • 対応バージョン:Stata 17以降

日付と時間を正確に操作するための便利な関数が追加されました。大きく3つに分類されます。これらの使用例を紹介します。

  • 日時期間関数:年齢や日時間の差分など、期間を計算する
  • 相対日付関数:ある日付を基準にした次の誕生日のように、相対的な日付を計算する
  • 日時要素関数:日時データから任意の要素を抽出する

区間打ち切りCoxモデル

  • 対応バージョン:Stata 17以降
  • セミパラメトリックCox比例ハザードモデルは、一般に非打ち切りや右側打ち切りのイベント時間データの分析に使われてきました。Stata 17の新しい推定コマンドstintcoxは、区間打ち切りイベント時間データにCoxモデルをフィットします。
  • 区間打ち切りとは、関心のあるイベントの時間が直接観測できず、ある期間を置いて知るような場合を指します。このような区間打ち切りを無視すると、偏った分析結果が生じる可能性があります。

Lasso変数選択を利用した処置効果モデル

  • 対応バージョン:Stata 17以降
  • コマンドtelassoを使うことで、多くの共変量を機械的に取捨選択しマッチングを行い、処置効果を推定します。
Lasso処置効果モデル

Jupyter NotebookでStataを使用する

  • 対応バージョン:Stata 17以降
  • IPythonを使うと、Jupyter NotebookからStataとMataを呼び出すことができ、PythonとStataの両方の機能を組み合わせることができます。

潜在クラスモデリング

  • 対応バージョン:Stata 16以降
  • 潜在クラス分析(LCA)は , 母集団に存在する、観測できないグループ分けを特定し, 標本ごとのグループへの所属や, そのグループの特徴が他のグループとどのように異なるかを知ることができます
潜在クラスモデル

ダイナミックレポート

  • 対応バージョン:Stata 16以降
  • dyndocコマンドはダイナミックタグを含むMarkdownテキストからHTMLまたはワード文書を作成する機能です。Markdownテキスト内に埋め込まれたStataのコマンドを実行し、分析結果の表やグラフを含むレポートを作成します。

差分の差分(DID)モデルとDDDモデル

  • 対応バージョン:Stata 17以降
  • Stata 17の新たな推定コマンドdidregressxtdidregressは、繰り返し計測されたデータに対して差分の差分(DID)モデル差分の差分の差分または三重差分(DDD)モデルをフィットします。
  • DIDとDDDモデルは繰り返し計測されたデータに対する処置における平均処置効果を推定するために使用されます。処置効果とは、例えば、血圧に対する薬物療法の効果や従業員の教育プログラムの効果などを指します。

クラスター分析
(階層型)

  • クラスター分析はグルーピングを行うための分析手法です。
  • Stataでは、階層型と非階層型のクラスター分析が実装されていますが、本資料では階層型について取り上げます。

主成分分析

  • 主成分分析はデータの次元圧縮を行う多変量解析手法です。
  • Stataでは、pcaコマンドまたはpcamatコマンドを使用して主成分分析を行うことができます。

クラスター分析
(非階層型)

  • クラスター分析はグルーピングを行うための分析手法です。
  • Stataでは、階層型と非階層型のクラスター分析が実装されていますが、本資料では非階層型について取り上げます。

ガルブレイスプロット

  • 対応バージョン:Stata 17以降
  • ガルブレイスプロットは、メタ分析のストーリーをグラフで表現する方法です。
  • ガルブレイスプロットは、研究それぞれの固有の効果量とその精度、全体的な効果量、潜在的な外れ値の検出に関する情報を表示します。効果量間の異質性を評価することもできます。
ガルブレイスプロット

Leave-one-outメタ分析

  • 対応バージョン:Stata 17以降
  • Leave-one-out(一個抜き)メタ分析は、分析ごとに1個ずつ研究を除外して、複数回のメタ分析を実行します。
  • 研究では、一般的に誇張された効果量が生じます。これは、全体の結果を歪める可能性があります。
  • Leave-one-outメタ分析は、全体的な効果量推定における各研究の影響を調べ、影響力のある研究を特定するのに有用です。

表作成機能

  • 対応バージョン:Stata 17以降
  • Stata 17では従来のtableコマンドが改良されました。collectプレフィックスを用いてあらゆるコマンドの実行結果を「コレクション」として保存し、表作成、様々な形式へのエクスポートが可能となりました。
  • よく使用する表の形式を「スタイル」として保存し、他のデータから作成した表に適用できます。「スタイル」を共同研究者と共有することもできます。

Lasso

  • 対応バージョン:Stata 16以降
  • least absolute shrinkage and selection operator (lasso) はモデルの係数を推定し、その推定はどの共変量をモデルに組み込むべきかを選択するのに使われます。
  • lassoは、多くの潜在的な共変量のうちのいくつかがアウトカムに影響を与える場合に最も有用です。そして、影響を与える共変量のみをモデルに含めることが重要です。

拡張回帰モデル (ERM)

  • 対応バージョン:Stata 16以降
  • 拡張回帰モデル(ERM)とはStataが独自に付けた名前で、線形回帰、区間回帰、プロビット、順序プロビットモデルなどを推定する際に生じる、次の問題に対応する場合に使用します。
    • 内生性
    • サンプルセレクション
    • 非無作為割り付け
    • パネルデータにおける個体内の相関
  • ERMを利用すれば、これらの問題のあるデータを使用しても、有効な推論を行うことができます。

有限混合モデル(FMM)

  • 対応バージョン:Stata 16以降
  • FMMの主な概念は、観測されたデータがいくつかの非観測な部分母集団から構成されているとするものです。
  • FMMは柔軟性があるため、観測値の分類、クラスタリングの調整、および非観測な分散不均一性のモデル化などの目的のために、さまざまな分野で広く使用されています。
  • この例題では、正規分布の混合を使用して多峰性データをモデル化する方法について解説します。

DSGEモデル

  • 対応バージョン:Stata 16以降
  • DSGEモデルとは経済学、特にマクロ経済学で政策分析と予測に使用される多変量時系列モデルです。
  • この例題では、はじめに非線形形式でモデルを記述してパラメータを推定します。次にモデルを線形変換してパラメータを推定します。一般的なDSGEモデルのフレームワークを理解することを目的とします。

空間自己回帰(SAR)モデル

  • 対応バージョン:Stata 16以降

Stataは地理情報システム(GIS)を正式にサポートしています。地図データのインポートと加工、グラフ化、空間自己回帰(SAR : spatial autoregressive) モデルのためのコマンドについて解説します。

  • 第一部 地理情報システム(GIS)とStata ― 東京都の地価データを地図上に表示
  • 第二部 空間自己回帰モデル ― 失業率と大学卒業率の関係をモデル化

項目応答理論(IRT)

  • 対応バージョン:Stata 16以降
  • 研究では、学習能力や性格特性など、直接観測できない潜在的な特性を扱うことがあります。IRTモデルは、観測できる個々の項目がどのように潜在特性に関連し、またこれらの項目グループ全体がどのように潜在特性に関係しているのかを調べます。
  • IRTモデルは、一次元の確認的因子分析(CAF)のバイナリおよびカテゴリカルな結果への拡張モデルや、一般化線形混合効果モデルの特殊なケースとして考えることができます。

選択モデル

  • 対応バージョン:Stata 16以降
  • 選択モデル(Choice Models)は、選択の結果を利用するデータのモデルです。単一の選択をする離散選択モデルと、選択肢をランク付けする順序選択モデルの2種類があります。
  • この資料では離散選択モデルを例に、選択データの操作と要約、モデルのフィット、およびそれらのモデルの結果の解釈に関するコマンドについて解説します。

メタ分析

  • 対応バージョン:Stata 16以降
  • メタ分析とは、過去に報告されたいくつもの研究を統合して、研究全体の推定値を得る解析方法です。
  • この例題集では、メタ分析の概要とサブグループのメタ分析、累積メタ分析などについて説明します。
  • フォレストプロット、バブルプロット、ファンネルプロットを作成することもできます。

構造方程式モデリング(SEM)

  • 対応バージョン:Stata 16以降

構造方程式モデリングを利用することによって、線形回帰モデルから同時方程式まで幅広いモデルの推定が可能になります。

  • 構造方程式モデリングを行い、コマンド操作でモデルの係数を推定します。
  • SEMビルダー(グラフィック操作)でパス図を作成します。パス図から推定を行うこともできます。
  • 作成したモデルに対して、適合度検定を行います。数種類の検定が実行されるので、用途に合った検定を使います。

マルチレベル混合効果モデル

  • 対応バージョン:Stata 16以降

回帰分析における誤差項をランダム効果として、追加的にモデルに組み入れます。パネルデータ分析とは異なり、係数(傾き)にも個体の異質性を反映させることができます。

  • ランダム切片の2レベルモデル
  • ランダムスロープの2レベルモデル
  • 相関のある変量効果の2レベルモデル
  • ランダム切片の3レベルモデル
  • 独立残差分散構造 など

時系列分析

  • 対応バージョン:Stata 16以降

短期的な将来予測を行うためのARIMAモデルの分析方法を紹介します。

  • ARIMAモデル
  • 季節効果を持つARIMAモデル
  • ARIMAのIRF(インパルス応答関数)結果
  • ダイナミック予測
  • コレログラムの作成 など

生存分析

  • 対応バージョン:Stata 16以降
  • Kaplan-Meier法による生存関数グラフの作成:生存確率(イベント発生確率)の時間変化を調べます
  • Nelson-Aalen累積ハザード関数のグラフ作成:死亡確率の時間変化を調べます
  • ハザード関数の推定:Nelson-Aalen累積ハザード関数を平滑化します
  • Cox比例ハザードモデルのグラフ作成:説明変数がハザード関数に影響を及ぼしているか否かを調べます

サーベイデータ

  • 対応バージョン:Stata 16以降

シングルステージデザイン、マルチステージデザインのサーベイデータを用いて分析を行う方法を紹介します。

  • 母集団の平均の推定
  • サーベイ回帰
  • Cox比例ハザードモデル
  • 平均比較
  • デザイン効果 など

多重代入

  • 対応バージョン:Stata 16以降

代入とは、欠損したデータを尤もらしい値で補う方法であり、複数の値から代入を行うのが多重代入です。

この「代入」では、欠損値のあるデータを複数の尤もらしい値で置き換えて、表現します。

ベイズ推定

  • 対応バージョン:Stata 16以降

ベイズ分析では、未知のパラメータを持つ対象について、確率的な分析を行うことができます。

ベイズ分析の特徴は、分析の事前情報を取り込んで、立てた仮説の確率を頻度統計と比較してより直感的に求めることができるというところです。

テクニカルサポート

ご不明な点がございましたら、お気軽にテクニカルサポートまでお問い合わせください。

  • お問い合わせの際には、「製品名」「バージョン」「シリアル番号」を併せてご連絡ください。
  • サポート対象は最新バージョンのみとなります。旧バージョンは開発元StataCorp.がサポート対応しておりませんので、予めご了承ください。

Stata is a registered trademark of StataCorp LLC, College Station, TX, USA, and the Stata logo is used with the permission of StataCorp.

page_top_icon