Keichoのログから生成するRegroupマップの付箋レイアウト
バージョン7
https://gyazo.com/bf7998748c4920a9136d8997643a5173
行間を開けたが、もっと開けないとあんまり意味がないな
バージョン5,6
バージョン4
https://gyazo.com/f2fac48d13c67b1048836c51cb3abe71
スコアで足切りしたキーワードの最初の出現場所に付箋を追加
思いついたこと
一定以上に長い文章の入ってる付箋のメニューてspawnを選ぶと、その内容が入った複数行インポートダイアログが開くと良い
そこでどういう分割をしたかのデータを取っておけば学習データに使える
できた
バージョン3
https://gyazo.com/24107e766ebdf37aadfe5c0976440b64
これは一発言ごとのローカルな特徴抽出
やはりこっちの方がよい
こっちでは対話全体にわたる特徴が捨てられてしまう
そこでバージョン2からスコアの高いキーワードだけ取り出してはどうか
バージョン2では「2回以上」としたが、回数ではなくスコアで足切りすべきだ
バージョン2
https://gyazo.com/65e5e8e90d80b682c2cc19df3d74eded
2回以上出現したものだけに限定したもの
キーワード抽出の結果なので短すぎる断片が多い
バージョン1
https://gyazo.com/684e05233db02bbf59fb1a0b97cac9c7
単なるキーワード候補になったものを全部並べただけだとゴミが多い。2回以上出現したものに限るとよさそう。
右端の「回答全文」は当然字が細かくなるが、Regroup上ならズームインして読むことができるし「最悪これを見ればすべての情報がある」を担保することで、情報を失う不安を感じたり、チャットログとRegroupを行き来して見比べたり、ということがなくなる。
質問、回答、回答を刻んだもの、スコアの高いキーワード
https://gyazo.com/8d037f331d5b39178d8a727146b3a8fb
当初はキーワード全部入れるイメージだったが、実際にやってみるとゴミっぽいのでスコアの高いものだけにした
同じものが繰り返し表示されないようにした
「場所」「関係」「時間」もありかな