データの尺度
データの尺度
データはその性質から、大きく定性的データ(質的変数)と定量的データ(量的変数)に分けられ、さらに細かく4つの尺度(scale)に分類されることが多い
分析をする際には、尺度に応じて適切に変数を扱うことが必要になる
定性的データ(質的変数、カテゴリ変数)
量的な特性が無いデータ
名義尺度(nominal scale)
他と区別し分類するための名称のようなもの
例:男女、血液型、郵便番号、住所、本籍地、所属学部、学籍番号
順序尺度(ordinal scale)
順序や大小には意味があるが間隔には意味がないもの
例えば、1位+2位≠3位のように、足し算引き算ができないもの
例:1位 / 2位 / 3位…、1. 好き / 2. ふつう / 3. 嫌い、統計検定®1級 / 2級 / 3級 / 4級、がんのステージ分類におけるステージI / II / III / IV
定量的データ(量的変数)
量的な特性があるデータ
間隔尺度(interval scale)
目盛が等間隔になっているもので、その間隔に意味があるもの
例えば、気温が19℃から1℃上昇すると20℃になるとは言えるが、10℃から20℃に上昇したとき、2倍になったとは言えないもの
例:気温(摂氏)、西暦、テストの点数
比例尺度(ratio scale)
0が原点であり、間隔と比率に意味があるもの
例えば、身長が150cmから30cm伸びると180cmになると言えるし、1.2倍になったとも言えるもの
例:身長、速度、睡眠時間、値段、給料、幅跳びの記録