術前Cre、術後腎パネ、代謝性パネルを用いて、心臓外科オペ後のAKI発症予測モデルを構築・妥当性を評価した論文
Demirjian, S. et al. Predictive Accuracy of a Perioperative Laboratory Test–Based Prediction Model for Moderate to Severe Acute Kidney Injury After Cardiac Surgery. JAMA 327, 956–964 (2022).
所感:
一つのアカデミックセンターで2009-2019に実施された6万人の心臓外科患者で予測モデル構築、内的妥当性評価を実施。
外的妥当性は同じ州の別の3病院の患者データ4912人を用いた。
予測モデル構築は4段階あり、AUC(識別能)、赤池情報規定量(overfitting)、Spiegelhalter z-test(較正能)の3つのパラメータを基に予測性能が高く、overfittingしないモデルを段階的に評価して作成。
最終的に得られた予測モデルのAUCは非常に好成績。
個人的には、eTable5がまとまっていてわかりやすかった。
閾値の設定ごとに(当たり前だが)感度特異度が変わるので、スクリーニング目的なのか、ある種のリスク除外目的なのかによって求める閾値が変わってくることが容易に実感できる。
実際に自分の研究で予測モデルを作成するときは、何目的での予測なのか?を常に頭に入れておくのが大事だと感じた。
サブグループ解析:年代別(2000-2009vs2009-2019)、術前Cre値別、術後代謝性パネルの測定時間別を実施。
自分はサブグループ間で差なしと解釈したが、この場合はサブルグープ解析というよりもロバストさを評価する感度分析みたいな印象。Discussionにサブルグープ解析の解釈に言及がない(見つけられなかった)ので、筆者らが 何目的で行ったのか分からず残念。
methodには探索的のため〜〜と書いてあったので、差がないから不言及なのかも?
説明変数に用いた因子は、実臨床で普遍的に測定されるもので、臨床に即している。
Discussionにおいて、
従来のAKI予測モデルでは:
1)術前因子にフォーカスしており、あまりいい成績ではなかった
2)輸血量や大動脈バルーンの有無などが因子として組み込まれており、時代の経過や施設間ごとに使用の多寡が変化し得るものだったため、外的妥当性や経時的な性能維持が難しかった
と言及している。
この視点は非常に大事だと感じた。
複雑なモデルではなく、シンプルなモデルのほうがロバストで長く価値があるのだと思う。
術前因子だけでAKI予測が上手く行かなかったのは、各臓器の予備能力を評価することが予後予測には重要だと考えるが、術前因子だけではその予備能力を捉えきれず、術前後の変化(ある種の負荷をかけた状態)を見て初めて捉えられるのかもしれない。
術前に予備能力を推測する因子を上手く見つけられたら良いのだが。。
総括:
自分の研究の参考として読んだ論文。
さすがJAMA,さすが医学と言った感じで、そもそもの症例数が桁違いに多い。
サンプルサイズは真似できないけど、思考過程、説明変数の取り方、出来上がった予測モデルの臨床意義の見せ方はとても参考になる。
Discussionにも言及してあったが、この予測モデルでどれくらいAKIが減るのかが見もの。
予測モデルで実際に予後がどう変化したのか評価した論文があれば見てみたい。