思考の結節点2025-11-01
2次元に落としてからクラスタリングをするとクラスターの精度は下がる
では高次元でクラスタリングしてから2次元に落としたらどうなるか
混ざってしまってわかりにくい
追記: 2次元のケースと生のembeddingのケースしか試してない
2次元に落としてからクラスタリングしたら精度が下がる話を健さんに説明したことで頭が整理されて
「2次元に落としてからクラスタリングしたら精度が下がる」
「高次元(1500くらい)のままクラスタリングしたら可視化結果が読解困難」
ってところまでは正しくても
「10次元くらいに落としてからクラスタリングしたら精度が下がらず可視化結果も許容範囲」
という可能性があるなと気づいた
embedding がインサイト発見の障害であることに関しての解説
(nishio追記): 健さんとの議論を経て
「”インサイト”という言葉の解像度を上げていく必要がある」
「広聴AIなど散布図系の可視化であることによって得られるタイプのインサイトがある」
「各種ツールが何に向いているのかが言語化できると、広聴AIを使うメリットなどもより説得力高く説明できるようになる」
「その目的なら広聴AIよりまずCartographerをするのがいいかも」などとアドバイスできる
という結論になった
言語化が進むと書籍にもよいし、自治体の方とのコミュニケーションでも「こういう目的の時に使うとこういう結果が得られやすくて良い」と説明できて良い
多様なツールの何に向いているのかの言語化
広い意味で「ブロードリスニング」の分類
それが資料になると、色々な人が「そのニーズならこのツールが向いてるかも」といいやすくなる
インサイトの種類
広聴AIでは意見のクラスタが存在することはわかるが「書かなかった人たち」が賛成なのか反対なのかわからないため
Polisみたいに「自由記述で書いたもの」に対して「賛成反対投票」をすることで、ここのデータが得られる
「このようなトピックに人々は関心がある、見落としているのでは?」というスタイルのインサイト
インサイトを得るという視点から考える
深く掘り下げることによって専門知識のある人から詳細な情報を取ることができる
一人の人からよりリッチな情報を得ることができる
エンドユーザに高度な言語化能力を要求する
テーマに関連したことを詳しく知っていることが前提
「よくわからないけど、なんとなくいいと思います」みたいな人に深掘り質問をしても何も出てこない
Q: OSSになってる? A: まだなってないんじゃないかな
広い人に影響する抽象度の高いテーマに対しては、「意見をきかせてください」と言っても意見を言語化できない人が割といる
いどばたビジョンを運用する中で見えてきた「いきなりテキストで自分の意見を言える人は多くない」という問題意識の解決のためにYes/No型質問ですばやく意見の分布を得られるようにしたのがCartographer 広聴AIを運用する中で見えてきた「自分の意見がレポートのどこに行ったのかわからなくて受け止められた感が低い、フィードバックループが遅い」という問題意識の解決のために、ブレインストーミング的なアイデア出しに特化して高速な意見分布フィードバックを実現したのがfarbrain アイデア出し、ブレインストーミングの可視化
リアルタイム広聴AI
理論的な構成要素はほぼ同じ
Extractionで複数件の抽出をしないシンプル化をしている
意見をLLMで整形してembeddingするプロセスが十分速く動く時代なので可能になった
ブロードリスニング
1000人以上?
デプスリスニングとブロードリスニング
デプスリスニングにキーパーソン型とオンライン型がある
プロダクトの進化が集客能力の影響を受ける
オンラインデプスインタビューに数千件の参加者を呼び込めるのは安野さんの強み
いかにして多くの意見を集めるか?
Q: アテンションをどう集めるのか
(nishio)
JOINなんかみたいに「5000件アテンションが集まらなかったらやりません」とそもそも言ってたりする
たくさん種をまいてアテンションの集まったものを育ててる
火種を見つけて煽って火を育ててる
Shutaro Aoyama
(こないだの安野さんのデプスインタビューに数千件の意見が集まっていたのも同じですね)
(アテンションが集まるホットなトピックにて活用する)
(nishio)
たとえばクマの件で注目を集めてる自治体がクマに関する議論のPolisを立てればうまく拡散される可能性がある
数が集まることを前提としている広聴AIを最初に使うのではなくCartographerなどの小さくてもできるやつをやるべき
タウンミーティングで30人くらいから集めるのをやって可視化するのを先にやるとよさそう
Shutaro Aoyama
炎上案件トラッキングしてコミュニケーション取りに行くのやりたいですね
(nishio)顔と名前が知られてる身として炎上案件にタッチすると両側の陣営から「対立陣営の擁護者だ」とみなされて殴られるからいい感じに隠れ蓑を作りたいw
Shutaro Aoyama
どういった炎上案件の状況であればこういった手段に興味持ってもらいやすいのか理解したい
火種が小さい段階のほうがよい、都市部より田舎のほうがよい、みたいな傾向を理解できるとよさそう
議論してるとこの「既存の枠とぶつける機能」が広聴AIに必要な気がしてくる
(新機能実装しつつstable releaseもつくるのは大変そう)
Shutaro Aoyama
このあたり、「広く集めたい」のか「多様な意見を集めたい」のかどちらなのか決まっていると動きが決めやすい予感がしました