異常値
異常値は、測定、記録,データ入力のそれぞれの過程で発生する可能性がある。
しかし、飛離れた値が必ずしも「異常」であるとは限らない。
このようなデータの発生した原因をよく確かめる必要がある。
確たる根拠がないのに異常値を削除してデータ解析を行うのは誤りである。
飛離れた値が実際に存在し得るならば、そのような値に影響されない統計手法を選択するようにしなければならない(例えばノンパラメトリックな手法)。
outlier
;
abnormal value
外れ値
(
outlier
)