大規模RCTデータを用いて急性心筋梗塞に対する抗血栓治療後の30日死亡の予後予測モデルの構築と性能を評価した研究
Lee, K. L. et al. Predictors of 30-Day Mortality in the Era of Reperfusion for Acute Myocardial Infarction: Results From an International Trial of 41 021 Patients. Circulation 91, 1659–1668 (1995).
https://www.ahajournals.org/doi/10.1161/01.CIR.91.6.1659
<method>
- Design:
大規模RCT (GUSTO-1)を用いたretropsective study - Population:
ST上昇を伴うacute MI patient (発症から6h以内) between 1990-1993 in GUSTO-1 trial (n=41021) - Outcome:
30day all-cause mortality - model:
logistic multiple regression model - 変数:
- 連続変数はcubic splineで単変量での関連性を図示し線形性を評価し、非線形性ならsplineでつないで評価。
- 予測変数候補同士の相互作用も評価
- カテゴリカル変数は、χ二乗検定でOR算出
- 変数削減は実施していないっぽいが、30日死亡のアウトカムだけで2851人いるので、今回の変数の量であればいわゆる“at least 10 events per variable”は満たしているので無問題。
- 欠測補完:
- complete case=92%
- 多変量回帰による反復的に欠測補完を行っている
→MICEに類似したものなのかどうか引用文献を深読みできておらず不明。
- internal validation:
- 10-fold cross-validation
- bootstrap
- 性能評価:
- discrimination: ROC_AUC
- calibration: comparing predicted risk and obsearved risk
<results>
- 30d死亡は2851人(7%)
- 多変量ロジスティク回帰においてもアウトカムと強い関連が認められたのはage, Killip Class(MIの重症度合いと比例)など。詳細はfig2参照。
- 作成したprediction modelのROC_AUCは0.836と高精度な結果。
calibration性能も非常に良い当てはまり。 - internal validationにおいても、ROC_AUCは0.834と高い精度を保持していた。
<感想>
大規模RCTのデータを後ろ向きに使用して作成した予測モデル
n=41021とかなりデータサイズが大きいだけでなく、予測モデル構築のプロセスが堅実。
内的妥当性評価でcross-validationとbootstrapping両方で評価しているのは初めて見たが堅い評価方法だなと思う。
予測モデルの中では教科書にのるくらい有名な論文であり、ベーシックに着実な手法を取っているだけでなく、なぜその手法を用いたのか?という著者の考えを詳述してあり、とても勉強になった。
最新の予測モデル論文では、ある程度モデル構築の流れが定まっているので、方法の詳細や思考過程は記載がないことが多いため新鮮だった。
おそらく、この論文が最初に手法を打ち出して、その後多くの研究で真似され始めた、みたいな流れがあったんじゃないかと思う。
予測因子(リスク因子)として年齢やHR、血圧、梗塞部位などを使用し、χ二乗値やORを算出しているが、それらを予測モデルの性能の一部として扱うだけでなく、医学的な妥当性に踏み込んで考察しているところがとても良かった。
予測研究は因果推論とは区別して考える必要があり、得られる統計量や推定量は統計学的な関連の強さの指標に過ぎないが、それでもそこには因果関係が含有されている可能性も踏まえて、生物学的妥当性や機序に一歩踏み込んだ考察がなされると、論文としての面白さが増すなと思った。
Circulationに掲載され教科書に載るくらい有名な論文なのだが、予測研究に必要なポイントを抑えつつ、興味のある統計学的な知見、医学的な知見も整理してバランス良く記述・考察されており、今もなお参考にされている理由がわかった気がする。