キーワード検索革命
(2020/8/11)
Googleなどを使ってWebでキーワード検索するのは現在完全に常識になっているが、実はまだまだ改善の余地がある
Web以前から、情報検索(Information Retrieval, IR)といえば「キーワード検索」が主流である
昔のYahoo!のような階層的分類検索や、カテゴリを絞り込みながら検索するファセット検索、画像検索なども利用されてはいるが、圧倒的に広く利用されているのはキーワード検索である キーワード検索は「全文検索」と呼ばれることもあり、検索の対象となる文書や情報(本とかWebページとか)の中に検索キーワードが含まれているかどうかを調べるアルゴリズムである キーワード検索は大変便利なものだが、問題点も多い
1. キーワードにマッチする文書が沢山あるとき、欲しいものだけ取り出すことが難しい
Googleの登場以前はこれが大きな問題だった
マッチした文書をランキングするアルゴリズムがいろいろ利用されていたが精度は悪かった
Googleはページ間のリンク情報を利用するページランクアルゴリズムを発明し、これがとてもうまくいったので世界を制覇することができた 2. キーワードが含まれていない文書を検索できないので検索キーワードの選択が難しい
大抵のキーワード検索システムでは、文書に含まれていないキーワードで検索することができない
柔軟に対応するシステムが増えてきているが、キーワードが少しでも違っていると検索できないシステムもまだまだ多い
Kindleでは半角英文字で全角英文字を検索することすらできないorz
世の中のヘルプシステムが大抵役にたたないのはこれが大きな理由である
ヘルプシステムを便利に使えるようにするため、増井俊之.icon はHelpfeelというシステムを開発し、Nota社でサービスしている Helpfeelは「あらゆる単語でキーワード検索できるようにするため検索対象文字列を拡張する」というアイデアにもとづいており、大変効果が高いものである
さて、Helpfeelは一般向けのヘルプシステムに有効なものであるが、個人的に使っても便利なはずである