マルチレベルメタ分析
研究者が複数の研究の結果を分析したい場合、メタ分析を使用して結果を組み合わせ、全体的な効果の大きさを推定します。
既存のmetaコマンド群は、標準および多変量のメタ分析を実行するために使用されます。
報告された効果量は、地理的な場所(州または国)や行政単位(学区)などの上位レベルのグループ内にネストされている場合があります。
同じグループ(地区など)内の効果量は類似している可能性が高く、依存性があります。
この場合、マルチレベルのメタ分析を使用できます。マルチレベルメタ分析の目標は、全体的な効果サイズを合成するだけでなく、
この依存性を説明し、異なる階層レベルでの効果サイズ間の変動性を評価することです。
新しい推定コマンド meta meregress
および meta multilevel
を使用して、マルチレベルのメタ分析を実行します。
数学のテストの点数yに対する2つの教育方法の効果(平均差)を報告し、yの標準誤差をseで抽出した研究があるとします。
効果量は学校内にネストされ、学校は学区内にネストされます。3レベルのランダムインターセプトモデルを次のように適合させることができます。
. meta meregress y || district: || school:, essevariable(se)
または
. meta multilevel y, relevels(district school) essevariable(se)
共変量があり、ランダムスロープを含めたい場合は、meta meregress
を使用できます。
. meta meregress y x1 x2 || district: x1 x2 || school:, essevariable(se)
モデルを適合させた後、事後推定コマンドを使用して、マルチレベルの不均一性統計を計算したり、推定変量効果共分散行列を表示したりできます。
操作例
データセットの例: 変更された学校のカレンダー データ
多くの研究は、夏期の学習機会への学生のアクセスが異なるため、学年末の長い夏休みが学生間の学習ギャップに関連していることを示唆しています。
Cooper、Valentine、および Melson (2003) は、学年を延長せずにカレンダーを変更した学校について、マルチレベルのメタ分析を実施しました。 このデータセットは、11 の学区で実施された 56 の研究で構成されています。
一部の学校では、夏季休暇が長く、冬季および春季休暇が短い従来のカレンダーとは対照的に、年間を通じてより頻繁に短い休憩を特徴とする修正カレンダーを採用しました (たとえば、12 週間の学校の後に 4 週間の休暇)。
この研究では、伝統的なカレンダーの学生の学業成績と修正されたカレンダーの学生の学業成績を比較しました。 効果量 (stdmdiff) は、標準化された平均差であり、正の値は、変更されたカレンダーのグループで平均してより高い達成度を示します。
stdmdiff の標準誤差 (se) も各研究で報告されました。 まず、データセットについて説明しましょう。
. webuse schoolcal
. describe
マルチレベルのメタ分析: 定数のみのモデル
学校は学区内にネストされているため、3 レベルのランダム切片モデルに適合します。 これには、2 つの変量効果方程式を指定する必要があります。1 つはレベル 3 (変数のdistrictによって識別) 用で、もう 1 つはレベル 2 (変数のschoolによって識別) 用です。
. meta meregress stdmdiff || district: || school: , essevariable(se)
最初のテーブルには、さまざまな階層レベルのグループに関する情報が表示されます。各グループ (階層レベル) ごとに 1 行が表示されます。
2 番目の表には、固定効果係数が表示されます。 ここでは、全体の効果サイズ $\hat{\theta}$ に対応する切片のみが存在します。 $\hat{\theta}$の値は0.185で、95%CIは[0.019, 0.35]です。
これは、平均して、変更された学校のカレンダーに従っている生徒は、そうでない生徒よりも高いスコアを達成したことを意味します。
3 番目の表は、マルチレベルまたは混合効果モデルのコンテキストで伝統的に分散成分として知られている変量効果パラメーターを表示します。 分散成分の推定値は、各レベルに従って整理され、ラベル付けされるようになりました。
デフォルトでは、meta meregress は各レベルでのランダムな切片 (およびモデルに存在する場合は相関) の標準偏差を報告します。 ただし、代わりに分散オプションを指定して、分散 (およびモデルに存在する場合は共分散) を
レポートすることができます。$\hat{\tau_3}=0.255$ と $\hat{\tau_2}=0.181$ です。 これらの値は、さまざまな階層レベルにわたる異質性を評価するための構成要素であり、通常はそのコンテキストで解釈されます。
一般に、τl の値が高いほど、レベル l 内のグループ間でより多くの異質性が予想されます。
または、次のように meta multilevel コマンドを使用して指定することもできます。
. meta multilevel stdmdiff, relevels(district school) essevariable(se)
出力結果は省略します。
meta multilevel
コマンドは、実際に一般的に使用されるランダム切片メタ回帰モデルに適合するように設計されています。
マルチレベルの異質性
事後推定コマンド estat heterogeneityを使用して、効果サイズ間のマルチレベルの不均一性を定量化します。
Cochran の $I^2$ は、階層のすべてのレベルについて一緒に不均一性の量を定量化します。
$I^2$=90.50% は、効果サイズ間のばらつきの 90.50% が、サンプリングのばらつきではなく、データの真の不均一性によるものであることを意味します。
マルチレベルの Higgins–Thompsonの $I^2$ 統計は、階層の各レベルの全体的な異質性に対する寄与と、それらの結合寄与を評価します。 たとえば、学校間の不均一性または地区内の不均一性 (レベル 2 の不均一性) が最も低く、
データの全変動の約 32% を占めていますが、地区間の不均一性 (レベル 3 の不均一性) は全体の約 63% を占めています。
マルチレベルメタ回帰とランダムスロープ:調整変数の組込
変数 year_c を使用して 3 レベルのメタ回帰を実行し、地区レベルでランダムな勾配 (変数 year_c に対応) を含めます。
. meta meregress stdmdiff year_c || district: year_c || school: , essevariable(se)
変数 year_c の回帰係数の推定値は 0.006 で、95% CI は [–0.015, 0.027] です。 stdmdiff と year_c (p = 0.575) の間の関連性に関する証拠は見られません。
変量効果の共分散構造
year_c は異質性を説明しませんでしたが、例証の目的で引き続きモデレーターとして含めます。
デフォルトでは、(地区レベルでの) ランダム勾配とランダム切片は独立していると見なされます。 または、オプション covariance(exchangeable) を使用して、交換可能な共分散構造を指定できます。
noheader、nolog、および cformat(%9.3f) オプションを使用して、ヘッダーと反復ログを抑制し、小数点以下 3 桁で結果を表示します。
. meta meregress stdmdiff year_c || district: year_c, covariance(exchangeable) || school:, essevariable(se) noheader nolog cformat(%9.3f)
または、切片と勾配の間の相関を 0.5 に固定し、それらの標準偏差をデータから推定できるようにすることで、カスタムの共分散構造を指定できます。
. matrix A = (.,.5 \ .5,.)
. meta meregress stdmdiff year_c || district: year_c, covariance(custom A) || school:, essevariable(se) noheader nolog cformat(%9.3f)
ランダム効果の予測
以下では、predict、reffects を使用して変量効果を予測し、reses(, diagnostic) オプションを指定して診断標準誤差を取得します。
. quietly meta meregress stdmdiff || district: || school: , essevariable(se)
. predict double u3 u2, reffects reses(se_u3 se_u2, diagnostic)
. by district, sort: generate tolist = (_n==1)
. list district u3 se_u3 if tolist
ランダム切片 u3 は、全体の平均効果サイズからの地区固有の偏差です。 たとえば、地区 18 の場合、予測される標準化平均差は、全体の効果サイズよりも 0.14 高くなります。