多重代入 -Multiple imputation-
代入の新機能
- mi imputeコマンドは連鎖方程式 (ICE) を用いた多変量代入mi impute chainedをサポートしました。
ICEは多様な形式のデータを代入できる柔軟性の高い代入手法です。ICEの変数ごとの指定により、それぞれの変数に適した単変量代入手法を選択できます。変数は任意の欠損データパターンを持っていて構いません。変数ごとに別個のモデルを指定することによって、ある部分集合内の範囲や制約といった、ある種の重要な特性を取り込むことができます。
9種類の単変量代入手法のいずれかを用いた柔軟な代入モデルの構成。
代入変数に対する予測方程式のカスタマイズ(例:bmiのモデルからhsgradを省略する)。
条件付き代入を用いた変数の代入。
他の代入変数の方程式中での代入変数の一般式の許容(例:ageの代入モデル中へのbmi^2の包含)。
-
4つの単変量代入法が追加されました。それらは単調法や連鎖方程式法を用いた多変量代入に対する構成要素としても使用できます。
- mi impute truncregは切捨て回帰法を用いることによってある制限された範囲の連続変数を代入します。
- mi impute intregは区間回帰法を用いることによって連続的打切り変数を代入します。
- mi impute poissonはポアソン法を用いることによってカウント変数を代入します。
-
mi impute nbregは負の二項法を用いることによってバラツキの過剰なカウント変数を代入します。
-
conditional()オプションにより条件付き代入がサポートされました。多変量正規代入 (MVN) を除くすべての代入手法が利用できます。
条件付き代入はデータの特定の部分集合内で定義される変数の代入を可能にします。その部分集合の外側では変数値は一定であるものとします。例えば、妊娠の回数は女性にのみ関係するもので、男性の場合には常に0となります。また高タールタバコの喫煙は喫煙者にのみ関係するもので、非喫煙者の場合には常に0となります。
例えば高タールタバコを喫煙しているかどうかについて適切な代入を行うには、喫煙状態をチェックする必要があります。すなわち喫煙者の欠損値に対する代入は喫煙者のデータに基づき行われなくてはならず、非喫煙者の欠損値については0で置換えを行う必要があります。喫煙状態を表す変数自体に欠損値が含まれていた場合にも、同様の操作ができることが望まれます。conditional()オプションによりそれが可能になります。
- mi imputeのby()オプションにより異なったグループごとに別個の代入を行うことが可能になりました。
- bootstrapオプションにより、ブートストラップサンプルからの事後推定を抽出することによる代入法がサポートされました(MVNを除く)。
- augmentオプションが指定された場合、完全予測はカテゴリデータの代入の過程でロジスティック、順序ロジスティック、あるいは多項ロジスティック代入法を用いることにより行われます。
- ワイド、mlong, flongスタイルの場合にmi imputeの性能は改善されました。
推定/事後推定の新機能
- 最終モデル中におけるシミュレーション誤差の量を推定します。それによってmi estimateのmcerrorオプションを用いたさらなる代入が必要かどうかを判断することができます。
- mi estimateはパネルデータや多層モデルをサポートしました。対象となるのはxtcloglog, xtgee, xtlogit, xtmelogit, xtmepoisson, xtmixed, xtnbreg, xtpoisson, xtprobit, xtrc, xtregです。
- mi estimateはtotalコマンドをサポートしました。
- mi predict, mi predictnlコマンドによってMI推定後、線形予測と非線形予測を計算することができます。
データ管理の新機能
- misstable summarizeのgenerate()オプションにより欠損値パターンを記録した要約変数を生成することができます。
Stata 12で追加された新機能の詳細についてはこちらを参照ください。
'Stata is a registered trademark of StataCorp LLC, College Station, TX, USA, and the Stata logo is used with the permission of StataCorp.'