階層的クラスタリングによる大きすぎるリンクの分割
from
大きすぎるリンクの分割
階層的クラスタリングによる大きすぎるリンクの分割
大きすぎるリンクが付いているページを
階層的クラスタリング
する
クラスタリングの情報としてはページに出てくる単語やリンク等の情報を使えば良い
似ているものは近く離れたものは離れる
適当な閾値を決めてやればそのタグがいくつかのグループに分割される