注目部分を切り出す
注意機構に似ているが、注意自体を人間にフィードバックする必要がある キーフレーズ抽出よりももう少し長い物が欲しい
キーフレーズだと、短すぎる
1つのデータから複数の識別器が学習される
1つの文章の各文字について識別課題になるので、素朴にデータを作るとでかい
28万行
interactiveモードが遅い
ダウンサンプリングを実装した
各点の前後5文字をとってunknownsに入れたのだが、その大部分は負例だし、5文字だけ見て教師にするの大変
事前にある程度教師を作らないといけないパターンか