数量化1類
目的変数が量的変数、説明変数が質的変数の場合の解析方法
回帰分析の場合の逆
つまり説明変数が100,101,102のような数値ではなく、「優」「良」「可」のようなカテゴリーである場合
ストーリー
1. 質的変数をダミー変数に変換する
2. 自由度調整寄与率を求めて得られた回帰式の性能を評価する
3. 説明変数の選択を行い、有用な変数を選択
4. 残差とテコ比の検討を行い得られた回帰式の妥当性を検討
5. 予測する
どうやってダミー変数を取り入れるか
例えば、「優」「良」「可」という質的変数がある場合
それぞれ「3」「2」「1」とした場合
「優」と「良」の差が、「良」と「可」の2倍と考えるとおかしい、ので不適切
「優」のとき1、そうでない時つまり「良」「可」のとき0とする
多重共線性問題p.89
2値の場合は、0,1だとしてもそうじゃなくてもそれに合わせて$ \betaが変わるだけなので、なんでもいい
けど、0、1のときが最も計算が楽なのでそう選んでいる
しかし、3値以上になると、それぞれの距離の問題が出てくるので、安易に1,2,3とかとはおけない
参考
『多変量解析法入門』