備忘録 as vet.

日々のアイデア、疑問など備忘録的に書きます。Scienceが好きです。

R

Rで予測モデルの性能評価(Cross ValidationとBootstrapの比較)

R

予測モデルの性能を評価するときは、データの過学習(Overfitting)を考慮する必要がある。 モデル構築で使用したデータに過剰に最適化され、新規データの予測性能が低下する問題が生じるため。 過学習は予測性能を過剰に見積もるバイアスの原因なので、さま…

Rでサンプルサイズと検出力、SDの関係をシミュレーションしてみた

R

大学院の授業でRを用いたサンプルサイズ(必要症例数)の算出方法のシミュレーションを学んだので、拡張して遊んでみた。 サンプルサイズの求め方はいくつかあるが、一例として α(有意水準)、β(検出力)、SD(標準偏差)、興味のある効果量の差、を決めることで算…