備忘録 as vet.

日々のアイデア、疑問など備忘録的に書きます。Scienceが好きです。

R

Rで柔軟にロジスティック回帰（MLE,lasso, ridge)のBias-corrected estimationを行う関数を自作してみた

R

Rで予測モデルの内的妥当性検証を行うためのパッケージはいくつか有るが、自分がほしい解析を一括で扱ってくれるいい感じのパッケージがなくて困っていた。特に、c-statistics, calibration slope, calibration interceptのbias-corrected estimationを最尤…

#R #予測モデル #臨床予測モデル #内的妥当性検証 #Bootstrap

Rで条件付き期待値の導出確認、χ二乗分布、F分布の確認

R

一般化線形モデルの勉強の一環として、条件付き期待値と確率分布の性質についてRの乱数シミュレーションで確認してみる条件付き期待値の性質相関関係のある乱数y1,y2を生成 set.seed(1) rho <- 0.7 x <- rnorm(n=1000,mean=0,sd=3) e1 <- rnorm(n=1000,mea…

#確率分布 #条件付き期待値 #R #シミュレーション

Rで予測モデルの性能評価(Cross ValidationとBootstrapの比較)

R

予測モデルの性能を評価するときは、データの過学習(Overfitting）を考慮する必要がある。モデル構築で使用したデータに過剰に最適化され、新規データの予測性能が低下する問題が生じるため。過学習は予測性能を過剰に見積もるバイアスの原因なので、さま…

#R #Bootstrap #予測モデル

Rでサンプルサイズと検出力、SDの関係をシミュレーションしてみた

R

大学院の授業でRを用いたサンプルサイズ(必要症例数)の算出方法のシミュレーションを学んだので、拡張して遊んでみた。サンプルサイズの求め方はいくつかあるが、一例として α(有意水準)、β(検出力)、SD(標準偏差)、興味のある効果量の差、を決めることで算…

#検出力 #統計学 #サンプルサイズ #R #シミュレーション