DBSCANとHDBSCANの違い
簡単に言えばHDBSCANはDBSCANのepsの値を自動調整する仕組み
実際のデータで実験して振る舞いを観察する
https://gyazo.com/b33420c5a98cd016a3eebd26a505ddbe https://gyazo.com/656733acc1eb23cd794e535f551d0786
2024-11-14
https://gyazo.com/ff7c969a58a1b63a88fc375355dab761
左下
HDBSCANではパラメータによらず左下の「はっきり分かれてるクラスタ」は全体をクラスタとして認識している
DBSCANでは末端部をノイズとして無視しており、パラメータの変化によってだんだん小さくなり、最終的に全部ノイズと判定している
右
振る舞いに大差ないがHDBSCANの方が周囲のノイズをクラスタの一部だと判断して巻き込んでしまうことが多いね