可視化において気をつけるべきこと
#テーマ1
縦軸の数値の幅→これによっては比例関係または反比例関係があると錯覚する場合があるので、気をつけるべきである
散布図のグラフの作り方
実際には相関が無いのにもかかわらず、あるように見せてしまったり、逆の場合もある。
ex)平日と休日を分けるのを忘れて勉強時間や遊び時間に相関を間違って認識させること
これらのことを 疑似相関という。
そして、このなかには両方の独立した要素に相関関係を与える交絡因子というものがある
この図でいうと、年齢である。そして、交絡因子が別の2つの相関関係を示すデータに要素として入り込んでしまっている状態を交絡という。つまり、年齢が年収と血圧の関係にデータとして入ってしまっているために影響を与えていることである。
https://gyazo.com/24a3d2703512ee9fa2fee34d16eb70a2
参考サイト:https://trickjp.info/2017/07/06/疑似相関の事例と4つの見抜くポイント/
交絡と交絡因子について https://www.dr-kid.net/entry-2018-10-13-053403