散布図
#テーマ2
Xが大きいほどYも大きいYが大きいほどXも大きい XとYの間には正の相関がある
大きいほどYは小さいYが大きいほどXは小さい XとYの間には負の相関がある
XとYの大きさに関連はない XとYは無相関である
共分散2変数の関係を表す統計量
$ s_{xy} =\dfrac{1}{n} \sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})
XとYの間に正の相関があるとき、正の値をとる。
相関関係が強いほど、共分散は大きくなる。
負の相関があるとき、負の値をとる。
相関関係が強いほど、共分散の絶対値は大きくなる。
無相関のとき、0に近い値をとる。
共分散を標準偏差の積で割ったものを相関係数と呼ぶ
Xが相関係数の解釈の注意
(1) 外れ値があるとき外れ値は相関係数の値を大きく変えてしまう
(2) 曲線関係があるとき変数変換を行う必要がある
(3) 異質な集団が含まれる場合集団ごとに相関係数を求める必要がある68相関係数だけで判断せず、散布図を描くことが大事。
相関関係があるとき因果関係もあるとは限らない。
擬似相関