ジニ係数
ジニ不純度とも呼ばれる。
クラスが$ n個存在し、あるクラス$ x_nに所属する確率を$ p_nとした時
ランダムに1つのデータを取り出してクラスを記録する。
それを戻す。
再びランダム1つのデータを取り出してクラスを記録する。
この時、両方とも同じクラスではない確率。
$ p = 1 - {p_1}^2 - {p_2}^2 - \cdots - {p_n}^2 = 1 - \sum_{k=1}^n{p_n}^2
極端な例として、
すべて1つのクラスに含まれている場合、p = 0 になる。
2つのクラスがある時、両方の確率が 0.5 だった場合、p = 0.5 になる。