Dropout

データサイエンスについて勉強したことを書いていきます。機械学習、解釈性、因果推論など。

シミュレーション

Accumulated Local Effects(ALE)で機械学習モデルを解釈する

はじめに Partial Dependence 特徴量が独立の場合 数式による確認 PDの実装 特徴量が相関する場合 PDがうまく機能しない原因 Marginal Plot Marginal Plotの数式 Marginal Plotのアルゴリズム Maginal Plotの実装 Accumulated Local Effects ALEのアイデア A…

因果推論とOLS:OLS推定量は何を推定しているのか(Słoczyński, 2020)

はじめに OLS推定量は何を推定しているのか シミュレーション OLS推定量の理論値の確認 まとめ 参考文献 はじめに こちらの@yohei_econさんのツイートを見て知ったのですが、OLS推定量が一体何を推定しているのかを因果推論の文脈で改めて考え直す論文が発表…

バイアス-バリアンスの分解と、アンサンブルの話

はじめに バイアスとバリアンスの分解 シミュレーションでバイアスとバリアンスの関係を確認する シミュレーションの設定 シミュレーション結果の確認 バイアスとバリアンスのトレードオフを可視化する モデルのアンサンブルでばらつきを抑える アンサンブル…

多重共線性と回帰係数の信頼性の話。あとリッジ回帰。

はじめに 多重共線性とOLS推定量の信頼度 線形回帰モデルの導入 OLS推定量 Annihilator Matrix OLS推定量の別表現 補助回帰 OLS推定量の分散を解釈する シミュレーションによる信頼度の確認 シミュレーションの設定 多重共線性とOLS推定量の信頼度 サンプル…

Influence Functionでインスタンスの重要度を解釈する

モチベーション インスタンス重要度の定義は? Leave One Outによるインスタンス重要度の計算 Influence Functionでインスタンス重要度を近似する 記法の導入 Influence Functionの導出 パラメータの性質 線形回帰モデルの場合 線形回帰モデルのInfluence Fu…

Ridge回帰の使い所を考える

はじめに 本記事では回帰係数の推定方法としてのRidge回帰(L2正則化)の使い所について考えたいと思います。 結論から言うと、サンプルサイズが不十分な状況下でRidge回帰を用いてより真の値に近い回帰係数を得る確率を高めるという使い方ができそうです。 …