擬似相関
from 層別の相関、擬似相関、相関と因果
隠れた相関、隠れた無相関
データをなんらかのカテゴリに分けると相関のようすが異なることがよくある
擬似相関、擬似無相関
「第三の変数」に影響を受けている場合、このようなことが起こることがある
共通の要因、「交絡因子」ともいう
交絡因子の影響を除いた偏相関係数というものもある
https://gyazo.com/56b32f18294a8efd3ee81f9e0fc8b98b
擬似相関を見抜く難しさ
擬似相関を見抜くのはかなり難しい
たとえば下の例
https://gyazo.com/e6cc285a30ad1488c32641380377677b
日本語文章検定とTOEIKは学年で層別にしてもすべて正の相関
https://gyazo.com/fca655cf812d9fa44051a2850fde7c1d
学年(時間)に影響されない正の相関があるといえる
しかし、その背後には「言語能力」のような要因があるのかも?
その背後には「家庭の財力」のような要因があるのかも?
その背後には……
対象に関する知見(ドメイン知識)や想像力が必要になる
2変数の相関をみるだけでは限界がある
3変数以上の関係を総合的に扱う多変量解析も重要になる