転置インデックス
とは?
英語だと Inverted index
何を 転置 するのかというと、テキストと出現レコードの関係
文字列を、ある単位で分割する
特定のレコードに対し、どの文字列が出現しているか?を表にできる
これを転置すると、特定の文字列が、どのレコードに出現しているか?を辿れる
文字列の断片と、出現箇所のマッピングの表
検索の流れ
1. 検索ワード が入力される
2. 検索ワード をトークナイズする
例) 転置インデックス -> 転置 置イ イン ンデ デッ ック クス
3. トークン毎に、転置インデックスからデータを取ってくる
4. 全てのトークンが含まれるドキュメントがマッチするドキュメントを結果として返す