層別解析
次の散布図は各都道府県の年間日照時間と年平均気温の関係を表したものです。年間日照時間が長い都道府県ほど年平均気温が高いことが分かります。相関係数を計算すると「0.56」でした。
https://gyazo.com/ed8b8895e98f857ab821a3e205f7bbf2
出典:総務省統計局 社会生活統計指標-都道府県の指標-2015
ただし、47都道府県の中には冬に雪がたくさん降る場所とそうでない場所が含まれています。そこで、雪がたくさん降る場所を「年間の雪日数が30日以上の都道府県」と定義し、47都道府県のデータを「雪の多い都道府県」と「雪の少ない都道府県」の2つに分けて散布図を描いてみました。
https://gyazo.com/68a60d276777263dec230ae57d6aed1d
雪の多い都道府県と少ない都道府県で2つに分けたデータで年間日照時間と年平均気温の相関係数を求めると、それぞれ「0.58」と「-0.50」となりました。このように、データの中にいくつかの異なる性質の集団が含まれている場合、データを分割して解析することができます。この方法を「層別解析」といいます。
引用・参考
Bellcurve:ホーム > 統計学の時間 > Step1. 基礎編 > 26. 相関分析 > 26-5. 層別解析
2020年12月2日閲覧