外れ値
外れ値とは、得られた観測値の中で真の値の推定値からの残差が異常に大きい値のことです。外れ値のうち、測定ミス・記入ミス等原因が分かっているものを「異常値」とよぶ場合があります。例えば、男性を「0」、女性を「1」で入力するアンケート調査に対して「2」が入力されていた場合、「2」が異常値となります。
外れ値の探索には、箱ひげ図、外れ値検定、クラスター分析が用いられる。 https://gyazo.com/2ee8cfc827f44aa24d68f967ef724e57
箱ひげ図を描いた場合、ひげの範囲から外れた値は外れ値とみなされます。ひげの上端は「第三四分位数+1.5×IQRより小さい最大値」を、ひげの下端は「第一四分位数-1.5×IQRより大きい最小値」を表しています。