備忘録 as vet.

日々のアイデア、疑問など備忘録的に書きます。Scienceが好きです。

R

Rで柔軟にロジスティック回帰(MLE,lasso, ridge)のBias-corrected estimationを行う関数を自作してみた

R

Rで予測モデルの内的妥当性検証を行うためのパッケージはいくつか有るが、自分がほしい解析を一括で扱ってくれるいい感じのパッケージがなくて困っていた。 特に、c-statistics, calibration slope, calibration interceptのbias-corrected estimationを最尤…

Rで条件付き期待値の導出確認、χ二乗分布、F分布の確認

R

一般化線形モデルの勉強の一環として、条件付き期待値と確率分布の性質についてRの乱数シミュレーションで確認してみる 条件付き期待値の性質 相関関係のある乱数y1,y2を生成 set.seed(1) rho <- 0.7 x <- rnorm(n=1000,mean=0,sd=3) e1 <- rnorm(n=1000,mea…

Rで予測モデルの性能評価(Cross ValidationとBootstrapの比較)

R

予測モデルの性能を評価するときは、データの過学習(Overfitting)を考慮する必要がある。 モデル構築で使用したデータに過剰に最適化され、新規データの予測性能が低下する問題が生じるため。 過学習は予測性能を過剰に見積もるバイアスの原因なので、さま…

Rでサンプルサイズと検出力、SDの関係をシミュレーションしてみた

R

大学院の授業でRを用いたサンプルサイズ(必要症例数)の算出方法のシミュレーションを学んだので、拡張して遊んでみた。 サンプルサイズの求め方はいくつかあるが、一例として α(有意水準)、β(検出力)、SD(標準偏差)、興味のある効果量の差、を決めることで算…