転置インデックスを作る流れ
from 転置インデックス
まず全文書をtermに分解する
形態素解析
各termがどのページで使われているかを表す表を作る
table:a
私 は 元気 おにぎり です アンパンマン はすける わっしょい
p.1 1 1 1 0 0 0 0 1
p.2 0 0 0 1 1 1 0 1
p.3 0 0 0 0 0 1 1 0
↑この表を転置した表を作る
この際にキーワードをあいうえお順、アルファベット順にソートする
table:b
p.1 p.2 p.3
アンパンマン 0 1 1
おにぎり 0 1 0
元気 1 0 0
私 1 0 0
です 0 1 0
は 1 0 0
はすける 0 0 1
わっしょい 1 1 0
これこんな感じにする↓と完成
よく見る索引だmrsekut.icon
table:c
アンパンマン p.2, p.3
おにぎり p.2
元気 p.1
私 p.1
です p.2
は p.1
はすける p.3
わっしょい p.1, p.2
/mrsekut-book-4908686130/038