〈T3〉データの相関03:相関関係と疑似相関
相関関係とは?
疑似相関とは
2つの事象に因果関係がないのに、見えない要因(潜伏変数)によって因果関係があるかのように推測されること。擬似相関は、客観的に精査するとそれが妥当でないときにも、2つの集団間に意味の有る関係があるような印象を与える。【参考(1)】
上記の通り、あくまで「因果関係があるかのように推測されること」であるから、その2つのデータに因果関係がない場合でも、因果関係があるような印象を与え得るため、人を騙したいときに有効に使用できると言える。
具体例を考えてみる。
例えば冬は、その季節上、ヒートショックによる死亡事故が増える。また、冬は、同じくその季節上、スリップ等の気候に起因する事故も増える。したがって、ヒートショックによる死亡事故件数と、スリップ等に起因する事故件数の間には、正の相関があるといえる。
どちらも、原因は冬の気候に起因する。この場合における冬の気候を潜在変数(見えない要因)ということができる。
この例では、ヒートショックとスリップ等に起因する事故において、疑似相関が見られる、ということができる。
【参考】