相関係数
ピアソンの積率相関係数
$ \rho = \frac{COV(X,Y)}{(VAR(X)VAR(Y))^\frac{1}{2}}
2つの確率変数X,Yの期待値(それぞれの分散と共分散)から計算される。
共分散COV を ぞれぞれの分散の積のrootで割る。 種類
ピアソンの積率相関係数
ケンドールの順位相関係数
相関のある乱数を作る
独立な2つの乱数の足し算で作れる
データ2系列取る。それぞれ平均を計算する。で、共分散を計算する。それを、それぞれの標準偏差で割る。 3系列以上でも、2つの組み合わせなので、同じか。
外れ値の影響
2系列を、x,yと考えて、ある外れ値を考えると、 xの外れ具合のyの外れ具合の積和なので, x,yともに平等に効いてくる。 もし、下図のA,Bで、A,Bも除外対象になるような点だけど、どっちが相関係数の値への影響が大きい?かというと、 Bの方が相関係数に支配的?になる?
https://gyazo.com/e84bfe7f535a1167d7dedb6125fe491e
相関関係で言われること
係数ではなく、関係?の話で。
潜在変数による擬似相関がある。
このあたりは、よく言われる部分