ケンドール
ケンドールの順位相関とは
ケンドールの順位相関係数(ケンドールのタウ)とは,n 個のペアのデータ:$ (x_1,y_1),\dots,(x_n,y_n) から計算される,$ X と $ Y の関係を表す指標の1つです。
$ (x_i,y_i) と$ (x_j,y_j) という2個のペアのデータについて,
$ (x_i−x_j)(y_i−y_j)>0 のとき「順方向」
$ (x_i−x_j)(y_i−y_j)<0 のとき「逆方向」
と呼ぶことにします。
(2個のペアの選び方は全部で$ {}_n \mathrm{C}_2 通りあります)
このとき「順方向のペア数ー逆方向のペア数」を$ {}_n \mathrm{C}_2で割った値をケンドールの順位相関係数と言います。
$ ケンドールのタウ = \frac{(順方向のペア数ー逆方向のペア数)}{{}_n \mathrm{C}_2}
意味、性質
「 X が大きいほど Y が大きい傾向にある」とき順方向のペア数は多くなります。逆に「 X が大きいほど Y が小さい傾向にある」とき逆方向のペア数は多くなります。よって,ケンドールの順位相関係数が大きいほど「 X が大きいほど Y が大きい傾向にある」と言えます。
一般的な相関係数(積率相関係数)と違って,データの値を直接使うのではなく大小関係のみを考慮します
積率相関係数と同じ見方で問題ない
データの値は使わず大小関係のみ考慮される
x と y の順番が完全に一致しているとき,全てのペアが順方向になるので $ r=1 になります。また,x と y の順番が完全に逆転しているとき,$ r=-1 になります。
常に$ −1 \leq r \le 1 です。
確率分布 P(X,Y) から n 個のサンプル(x1,y1),⋯,(xn,yn) を生成したとき,X と Y が独立なら τ の期待値は 0 になります。
参考サイト
https://mathtrain.jp/kendall
サイト名 : 高校数学の美しい物語
タイトル名 : ケンドールの順位相関係数
参照日 : 2019/11/9
#テーマ3