生存モデルの適合度プロット
Stata 18では、新しいコマンドestat gofplot
を使用して、生存モデルの適合度(GOF)プロットを生成できます。
このコマンドは、4つの生存モデル(stcox
、stintcox
、
streg
、stintreg
)の推定後に使用できます。
モデルの適合度は、層別モデルの後または各グループごとに個別にチェックできます。
GOFプロットは、モデルがデータにどれだけ適合しているかを視覚的に確認するためのものです。 生存分析では、これらのチェックはいわゆるCox–Snell残差に基づき、モデルが正しい場合、これらの残差は標準指数分布に従うという 仮定に基づいています。視覚的には、これらの残差を推定された累積ハザードに対してプロットし、 プロットされた値が45°の直線に近いほど適合度が高いと判断されます(Cox and Snell 1968)。
操作例:stcox
実行後のGOFプロット
Stanford Heart Transplantation Programに入院した103人の患者のデータセットを使用します(Crowley and Hu 1977)。 このデータセットには、プログラムに受け入れられた年(year)、患者の年齢(age)、以前に心臓手術を受けたかどうか(surgery)、 移植を受けたかどうか(posttran)といった変数があります。 我々は死亡までの時間を分析し、モデルがデータに適合しているかどうかを確認したいと考えています。最初にCoxモデルを適合させます。
. stcox age posttran surgery year, nolog
このモデルのGOFを視覚的に確認するために、次のようにestat gofplot
コマンドを実行します。
. estat gofplot
青い線を黒い基準線と比較すると、Coxモデルがデータに適合していることがわかります。
右側打ち切りデータに対して、デフォルトのNelson–Aalen推定量(Nelson 1972; Aalen 1978)ではなく、
代替のKaplan–Meier推定量のマイナス対数を使用するにはオプションkm
を指定します(Kaplan and Meier 1958)。
では次に、異なるグループ(pgroup)の患者間で基準ハザード関数が異なるが、係数はそれらのグループ間で等しいと仮定する
層別Coxモデルを適合させてみましょう。
. stcox age posttran surg year, strata(pgroup) nolog
層別モデルの後で、estat gofplot
で stratify
オプションを使用して、pgroup の各層に対して個別のプロットを生成します。
. estat gofplot, stratify
このモデルは、すべての層のデータによく適合します。 pgroup = 2 の赤い線は、端に向かって基準線から外れています。 研究の終わりに近づくにつれて推定に利用できる観測値が少なくなるためであり、これが実際に見られることは珍しいことではありません。
プロットの視覚的検査を容易にするために、separate
オプションを追加して、層ごとに個別のグラフを作成することもできます。
. estat gofplot, stratify separate
操作例:stintcox
実行後のGOFプロット
我々は、乳房の縮小に対する 2 つの癌治療 (治療) の美容効果を比較する、早期乳癌患者を対象とした研究
(Finkelstein と Wolfe 1985) のデータセットを使用します。
患者はランダムな追跡時間で観察されたため、乳房収縮の正確な時間は観察されず、来院間の間隔(変数 ltime および rtime)内に
あることのみがわかっています。 まず、stintreg
を使用した治療における乳房収縮までの時間の区間打ち切りワイブルモデルを当てはめます。
. stintreg i.treat, interval(ltime rtime) distribution(weibull) nolog
estat gofplot
を実行して、GOFプロットを生成します。
. estat gofplot
区間打ち切りデータでは、Cox-Snell のような残差が定義され、プロットに使用されます (Farrington 2000)。 モデルがデータによく適合する場合、これらの残差は打ち切られた標準指数分布に近似するはずです。 また、累積ハザードを推定するために、ノンパラメトリックTurnbull推定量 (Turnbull 1976) が使用されます。 ギザギザの線は上のグラフの基準線の近くに留まっており、ワイブルモデルがデータによく適合していることを示しています。 次に、指数モデルを適合し、そのモデルのあてはまりを確認したいとします。
. quietly stintreg i.treat, interval(ltime rtime) distribution(exponential)
. estat gofplot
この GOF プロットを上記のプロットと比較すると、ワイブルモデルの方が指数モデルよりもデータによく適合していることがわかります。
参考
さらに詳しい内容につきましては、下記のマニュアルをご覧ください。