全文検索
データを
Elasticsearch
等につっこめば検索は簡単にできる
検索結果のソートが重要だと思う
shokai.icon
単語がたくさん連呼されていたら重要というわけでもないし
scrapboxの場合、更新日時が古くても重要なページもある
テキストの量が多ければ重要というわけでもない
とりあえず
Page Rank
っぽい物を作ってソートしてみている (2021/3時点)
被リンク数が多いページが重要
たくさんの被リンク数が多いページからリンクされているページがもっと重要
最終更新日も少し加味する
アルゴリズムが隠蔽されていると不安になる
隠されたスコアによる謎のソートではなく、理由を明示して納得させるUIを選んだのが
HeadWord