ベクトル埋め込みを使った大きすぎるリンクの分割
文章のベクトル埋め込み
を使った
大きすぎるリンクの分割
ベクトルに埋め込みます
k平均法で2〜5個にクラスタリングします
シルエット係数
が最適となるKを選ぶ
Polis: Scaling Deliberation by Mapping High Dimensional Opinion Spaces
悪くないのでは?
追加で「それぞれのグループ」をなんと呼ぶべきかのヒントも与えたい
ページ自体の他に、ページタイトルもベクトル埋め込みする
中で使われてるリンクの文字列もやってもいいかも
そして各クラスタの代表点に最も近いものを「クラスタを代表する文字列」とする
Top10くらい出してもいいかも