平均への回帰(Regression to mean)現象についての統計学的な説明と対処法について解説したチュートリアル論文
Barnett, A. G., Pols, J. C. van der & Dobson, A. J. Regression to the mean: what it is and how to deal with it. Int. J. Epidemiology 34, 215–220 (2005).
https://academic.oup.com/ije/article/34/1/215/638499
Clinical Prediction modelの教科書を読んでいてRegression to meanという用語が出てきたけど、なんとなくわかるようなわからないような、という感じだったので、ちょうどよく解説論文があったので腰を据えて読んでみた。
少しだけ理解が進んだ気がするが、まだ不十分。回帰モデルは難しい。。
ーーー
平均への回帰(Regression to mean; RTM)はランダムエラーにより生じる統計学的な現象。
観測を繰り返すごとに得られる観察値は真の平均値に近づくというもの。
一見当たり前の現象だが、なんらかの治療介入を行う前後で観測値の比較をするときに問題になることがある。
介入前後で観測値の確率分布がほとんど変わっていない(介入に効果がない)にも関わらず、RTMの影響であたかも介入前から介入後で値が変化する(観測を重ねるごとに値が真の平均値に近づいただけ)ことがあり、RTMの影響を真の介入効果と誤解釈する可能性がある。
RTMの存在を確認する方法:
横軸にbaseline、縦軸にbaselineからの変化量を取った散布図を作成。
観測されたbaseline値が元の分布の端に位置するときにより効果量が大きくなる場合、RTMが示唆される。
RTMの影響を低減する方法:
<研究デザイン時点>
・ランダム割付
・一時点で複数回測定を行い、平均値を採択するか、二回目以降の値を採択する
<データ解析時点>
・RTMの影響量を算出することでRTMの影響を調整した効果推定値を出す
・ANCOVAを使用する方法
RTMはランダムエラーによりどんな変数でも生じ得る現象なので、介入や曝露の前後で何らかの変化量が認められたときに、それが介入や曝露の影響と考える前に、RTMによる影響なのか否かを考慮する必要がある。