DBSCANにおけるクラスタの定義
gpt.icon
コア点(Core Point):ある点を中心とした半径ε以内に、少なくともminPts個の点が存在する場合、その点をコア点とします。 直接到達可能性(Directly Reachable):点pがコア点であり、点qがpから距離ε以内にある場合、qはpから直接到達可能とされます。 到達可能性(Reachable):点pから点qまで、連続する直接到達可能な点の列が存在する場合、qはpから到達可能とされます。
密度連結性(Density-Connected):点pと点qが、ある点oを介して互いに到達可能である場合、pとqは密度連結とされます。 これらの概念に基づき、DBSCANは以下のようにクラスタを定義します:
クラスタ:すべての点が互いに密度連結であり、クラスタ内の任意の点から他の点へ到達可能である最大の集合。
ノイズ点:どのクラスタにも属さない点。
このように、DBSCANはデータの密度に基づいてクラスタを定義し、ノイズ点を識別します。