類語をみつける方法
というか同じカテゴリの単語を複数見つける方法
同位語検索というらしい
画像なぞなぞ認証で偽答を作るのを自動化したい
たとえば「大阪」が正解のとき「神戸」とか「京都」とかの偽答を自動生成したい
「的場」から「菊地」を生成するとか 
http://hondana.org/%E5%A2%97%E4%BA%95/4812439914 http://gyazo.com/6c0f4f744676c2a71fc1577ace0557c7.png
「や」を使う方法
"大阪や" でググると「大阪や埼玉」「大阪や鳥取」などが出る
http://gyazo.com/cc94658d04bc123b1b807db482862488.png
京大田中研の研究 by 大島氏
論文
同位語検索エンジン「yayala」
らいばるサーチ・やーやら
簡易API利用例
結構使えるがテキスト処理しなければならないのは面倒
「鎌倉や」だとうまくいかない。そういう名前の店があるから。
Yahoo!の山下達雄氏の方法
Google Setsを使う方法
(Google Setsは動いてないようだ (2013/06/13 22:04:59))
単語ひとつだけでもうまくいく場合が多い (大阪)
http://gyazo.com/0028d03126fa8cd00025768a4af509eb.png
複数単語を与えても全然駄目な場合も (佐藤/増井)
http://gyazo.com/acc72b46b5914121425c81d2a177c8b3.png
Boo!Wa!を使う方法
サービス止まってる (2013/06/13 22:05:31)
CMUのLanguage Technologies Instituteの開発
SEALという方法の改良版らしい
複数単語指定必要で動作が遅いが、精度が高い
http://gyazo.com/5cd23f12348c9253c51de9e49afffc0e.png
Wikipedia Thesaurus
東大田中氏によるもの
まとめ
単語ひとつだけ使うならGoogle Setsを使うか「や」を使う
複数単語を使えるならBoo!Wa!は最強。ただし遅い。
自力でシソーラスを作ったりする必要はないことがわかった。うまくなぞなぞ認証システムに組み込みたい。
その他
そもそも同位語検索はどういう目的で使われるものなのだろう??
比較検索や補完的検索,文書の網羅性などの計算に利用されたりします
ありがとうございました!
taktak様
hiroshiy様
nakamura様
shn様
yto様
#ブログ
? Tips: 類語をみつける方法