R
Rで予測モデルの内的妥当性検証を行うためのパッケージはいくつか有るが、自分がほしい解析を一括で扱ってくれるいい感じのパッケージがなくて困っていた。 特に、c-statistics, calibration slope, calibration interceptのbias-corrected estimationを最尤…
一般化線形モデルの勉強の一環として、条件付き期待値と確率分布の性質についてRの乱数シミュレーションで確認してみる 条件付き期待値の性質 相関関係のある乱数y1,y2を生成 set.seed(1) rho <- 0.7 x <- rnorm(n=1000,mean=0,sd=3) e1 <- rnorm(n=1000,mea…
予測モデルの性能を評価するときは、データの過学習(Overfitting)を考慮する必要がある。 モデル構築で使用したデータに過剰に最適化され、新規データの予測性能が低下する問題が生じるため。 過学習は予測性能を過剰に見積もるバイアスの原因なので、さま…
大学院の授業でRを用いたサンプルサイズ(必要症例数)の算出方法のシミュレーションを学んだので、拡張して遊んでみた。 サンプルサイズの求め方はいくつかあるが、一例として α(有意水準)、β(検出力)、SD(標準偏差)、興味のある効果量の差、を決めることで算…