PR活用を支える技術(資料)
PR活用を支える技術(資料)
5/21 dd2030
マンパワーの不足の見込みを早めに共有・開示するという観点で言うと、僕は直近はチームみらいのポランティアチームの中でチームみらいのいどばたから得られた1400件のPRをどうするか的タスクの何も形がない状態のものに目鼻をつけて他のボランティアの方が参加できる機会をつくることにリソースの9割を取られてる感じなので当面広聴AIのことをやる余裕はないです
(そもそもその前は開示請求したバブコメのデータ、その前はPluralityイベントでもう数週間何もしてないから全然キャッチアップできてないよなという気もしてきた)
中山心太(tokoroten):
チームみらいのいどばたの件に関して
現状は1300件を捌くのにパンクしている(と、端から見えている)
likeが集まったPRの周辺のPRは統合して検討する必要がある
公聴AIでPRのマップを作成後、like数で属性フィルター、もしくは色変更をして、周辺PRを調査するのに役立つのではないか
端的に言うと、
今やってる属性フィルターのPRは、チームみらいに刺さりま刺さりせんか?
もしくは、何があったらチームみらいで刺さるようになりますか?
nishio:
いったんノーマルの広聴AIをやってみて、制作チームのニーズを満たせるかどうか判断、というフェーズで、ニーズに合わなさそうという肌感で優先度が落ちてる
が、まぁ、属性フィルターが有用なシチュエーションが多いのは間違い無いと思う
今回僕が観察したユーザの状況を解説すると
そもそもN人の専門家がいて、M個の分野を割とはっきり分担して持っている。ユーザからのPRも理想的には「分野」を指定して飛んでくるし、担当が受け取った上で「これはあちらの分野では?」となったら担当者間でやり取りが行われる。この状況でembeddingベースのクラスタリングにそもそもニーズがない。
実際には理想的ではない振る舞いとして分野を指定せずにREADMEに400件来てるので、それは再分類が必要。このときにクラスタリングがしたいかというと微妙にニーズに合ってなくて「既存の分類基準で分類」することの方がニーズがある
というわけで整理すると「広聴AIに入れてみるのはイージーな成果作りとして一定価値はある」「が、本質的に必要なのはそれではないと思うので本質的に必要なものをゼロから作ろうとしてる」という感じです
tokoroten:
まあ、そりゃそうだよね感。納得です。
この状況だと、自前で作ったほうが早い
nishio:
そしてGitHub APIのレートリミットで一度に全部取れないので差分取得する仕組みを作った→この後Markdownで吐く→Devinがそこを読むとか、コピーしてChatGPTに貼るとかでよくない? というのが現状の肌感
22:30
既存の分類基準で分類できないものが100件とかになってきたら新しい切り口を発見するために枠を決めないクラスタリングのニーズが出てくるかもね、という感じ。
5/25 dd2030
いどばたシステムから来たPRに対して受け手サイドで要約やラベル付けをするAIを走らせて現状対処していますが、
ニーズは普遍的だと思うのでいどばた側で吸収した方がいいかもです
出力例
みどころ:
信頼度付きのカテゴリ分類
タイトル変換(元タイトル“匿名ユーザーによる政策改善案(教育・子育て分野)” → 新タイトル “教育と子育て分野におけるリモート技術活用の政策改善案“)
実装
---
福祉ラベル分析実験結果(6/10)
2000件のPRに対して新しく作られた「福祉」カテゴリに入れるかどうか全件AIに検討させて理由付きで報告させる
AI使用料は$9.34