7762aa93ff14096
http://nhiro.org.s3.amazonaws.com/2/e/2ed46013716099af07a60132d98861d0.jpg https://gyazo.com/2ed46013716099af07a60132d98861d0
(OCR text)
97
距離
各行に対して、各クラスの中のすべての行との距
離を計算して、距離の分布を求め、その分布の
10, 25, 50, 75, 90th percentileを45次元の特徴量と
して加える
1位チームの「各クラスの最も近い点への距離」
は0パーセンタイルだけを使っていることに相当
する。階層的クラスタリングでの、ある点がどの
クラスタに最も近いかを判定する上で最も近い点
か最も遠い点かそれとも平均かセントロイドか..
という議論*に似ている。