ロバストなデータ
public.icon
外れ値
平均値は外れ値の影響を受けやすい
中央値は、平均値より外れ値の影響を受けにくい
ただ、標準偏差のかわりに使うときは、中央絶対偏差に1.4826をかけて補正する必要がある
ロバストな標準化を行った後の主成分分析 (Principal Component Analysis, PCA) をロバスト主成分分析 (Robust PCA, RPCA)、部分的最小二乗法 (Partial Least Squares, PLS) をロバストPLS (Robust PLS, RPLS) とよんだりします。 ノイズ
PCAで前処理した後に、たとえば目的変数との間で回帰分析をすることで、ノイズの影響を受けにくい回帰モデル、つまりノイズに対してロバストなモデルができる 過学習が起きたモデルは、ロバストなモデルではありません
参考