When Clean Data Is Actually Dirty
カートのアイテムが多すぎます
ご購入は五十タイトルがカートに入っている場合のみです。
カートに追加できませんでした。
しばらく経ってから再度お試しください。
ウィッシュリストに追加できませんでした。
しばらく経ってから再度お試しください。
ほしい物リストの削除に失敗しました。
しばらく経ってから再度お試しください。
ポッドキャストのフォローに失敗しました
ポッドキャストのフォロー解除に失敗しました
-
ナレーター:
-
著者:
概要
“Cleaning” data is often treated as a harmless preprocessing step.
Delete missing rows.
Fill gaps with the mean.
Move forward.
But cleaning is not neutral.
It is a modeling decision that can change:
- The estimand
- The sampling mechanism
- The bias–variance trade-off
In this episode, we examine the statistical dangers of deletion and simple imputation — and why naïve cleaning can quietly corrupt inference.
まだレビューはありません