Dropout

データサイエンスについて勉強したことを書いていきます。機械学習、解釈性、因果推論など。

回帰分析

因果推論とOLS:OLS推定量は何を推定しているのか(Słoczyński, 2020)

はじめに OLS推定量は何を推定しているのか シミュレーション OLS推定量の理論値の確認 まとめ 参考文献 はじめに こちらの@yohei_econさんのツイートを見て知ったのですが、OLS推定量が一体何を推定しているのかを因果推論の文脈で改めて考え直す論文が発表…

多重共線性と回帰係数の信頼性の話。あとリッジ回帰。

はじめに 多重共線性とOLS推定量の信頼度 線形回帰モデルの導入 OLS推定量 Annihilator Matrix OLS推定量の別表現 補助回帰 OLS推定量の分散を解釈する シミュレーションによる信頼度の確認 シミュレーションの設定 多重共線性とOLS推定量の信頼度 サンプル…

Ridge回帰の使い所を考える

はじめに 本記事では回帰係数の推定方法としてのRidge回帰(L2正則化)の使い所について考えたいと思います。 結論から言うと、サンプルサイズが不十分な状況下でRidge回帰を用いてより真の値に近い回帰係数を得る確率を高めるという使い方ができそうです。 …

purrrとbroomで複数の回帰モデルを効率的に管理する

私は探索的にデータを見てく段階では、可視化に加えて複数の回帰モデルを作成して比較をする、ということをよくやっています。 モデルの数が少ない場合は個別にモデルを作成してsummary()で見ていく事もできますが、モデルの数が増えるにつれてそのやり方で…