「あなたが使える社会保障制度を推薦する」は現状の大規模言語モデルの推測でも実現できない。今こそSemantic Dataの思想を引き継いでOpenFiscaについていこう
とりあえず、最初はtkgshn.iconが書いています
@hokutoyokoyama: リスティング広告やSNSを使い、関わりの入り口を作り、メール、LINE、チャットでやり取りをし、オンラインで申請書作成をサポートし、コンビニのネットプリントから印刷、窓口に行かれ、申請時に困ったことがあればLINE通話で繋ぎながらお手伝いするといったことは、10年前には出来得ないことだった。 アウトリーチにおけるリスティング広告の活用を知識創造したNPO法人OVA、オンラインの生活保護申請システム「フミダン」を開発された一般社団法人つくろい東京ファンド、その他さまざまなSaaSのおかげで、個人を支えるケースワークのプロセスにおけるテクノロジーの活用範囲は確実に拡がっている。 電話相談やテキスト相談において、特定のワードが出現した場合、担当者に対しアラートを出す/対応策を提案することを通し相談員の経験不足を補完する作動をさせるシステム開発をしていた日本企業が目指すそれを一瞬でChatGPTが追い抜かしていったと思う。純粋にChatGPTをいじって色々やってみたい...
さまざまな例や言い回しで試してみて、制度や相談に関しては現状では使いものにならない、というのは同じ認識なんですが、学習データで早晩解決されるのかとか、こちらの言語運用能力や理解力をやりとりから学習して、こちらに適した応答が今時点でできるのか、などなど知りたく!
@dai46u: @hokutoyokoyama やっぱ現状の相談支援系チャットボット(的な制度案内システム全般)は、ChatGPTに抜かされた感ありますよね……(もちろん現状の精度悪いですが、あきらかに時間の問題) 二年前くらいからの、各ステークスホルダーによる国内支援系チャットボット同士の競い合いが、こんな形で終結するとは……。
みんなに関しては、自分は元々Civichatを経営していたので、何度かカンファレンス等でも一緒に登壇したことがあったと思う。 何ができると思うか
これは、「AIがありもしないことをあたかもそのように話す」ことを示す単語になっている。
@0xtkgshn: 今日はOpenAIのドキュメントや他の人の実装例見てたけど、ファインチューニング次第でだいぶ「hallucination(幻覚)」や「stochastic parroting(確率的なオウム返し)」は減りそうな感じ。 なのでSemantic Dataを突っ込んだり、それらを支えるものは少なくとも同じ学習方法であろうGPT4ぐらいまでは有効だと思う。 あと、CLIベースとかのアノテーションというか、AI学習用CI/CD周りはGUIがないものが多くて、マスアダプションさせる感じではないと思った。いわばこれらの作業は"熟練のアノテーション職人"がまだやってると思う。でも今後、GPTを借りるハードルは下がっていくと思うので、fine-tuning問題は確実かも その幻覚を減らすためは、GPTであれば、Embedding APIをいい感じに使っておくことである程度は実用に耐えられるかもしれない temperatureというパラメータを下げるとうまくいくらしいtkgshn.icon
@0xtkgshn: Bitcoinのホワイトペーパーと、Ethereumのマージに関するEFからの記事を分けてあげて突っ込んで人間がスコアだけつけてファインチューニングで、 テンプレチャー(なんかどれだけ独自の思考を持たせるかみたいなパラメータ?)を幻覚を見させないために下げて叩くとこれ。 なので結論、中途半端にAIに突っ込んでも解決しないので、fine-tuningよろしくある程度Semantic Dataの思想をもとに作る必要があると思う。
叩いているソースコードを見ると、機能を提供するAPI(裏側)がCRMを作っている会社がやっていて、データ構造に不可逆性がありそうtkgshn.icon 公共制度の論理構造も独自のデータ構造。エクスポートできなそう、できるとしてもお金使わないとできない せっかく税金を使って造られたデータなので、なんとか民間やNPOが活用できるようにしてほしいと願ってますhealthy_sato.icon
例えば、
制度追加や改善などの更新事項
情報の保守運用のための内部連絡事項
など、RSSでもなんでもいいので公表してほしいです!healthy_sato.icon
tkgshn.iconが同じことをする場合なら…
他は民間に任せる
データ構造と、データを編集するのは別でいい。
管理画面を作る会社は3,4社あっていい。
ある程度のラインまでのソフトを作った会社に1000ドルとか。
まずプロトコルがあって、編集ソフトウェアがいくつかある
フロントエンドに関しては、別にどこかの会社が受注しなくていい
そう考えると、行政がSIerを雇うのはセンスがない 例えばChatGPTてとかは、どこからその情報引っ張ってきたのか説明できない。 そう考えると、論理的に利用条件が定義された制度推薦との相性はかなり悪いと思うtkgshn.icon それでも、あらかじめCPSVのように公共制度のデータ構造を定義しておくことで、推論での回答に加えて、論理的に入れ替えていいことできないことを示すことができる 制度の利用条件を論理的に定義、条件構造の明記化が進めばできると思うけど、現状の制度データはエクセルとかPDFとかで担当者がバラバラなフォーマットで公開しているので実現できない 画像の中に写っているものをエンドユーザーが入力する
これを使えば、機械学習にとっても、画像そのものとテキストの両方から学習できるようになる
まぁあとはそのOpenFisca互換のデータを作るGUIエディターかな?tkgshn.icon
👆これ具体的にはどんなものを想定してます?
個人的には、各省庁や自治体の既存データをOpenFisicaに変換するツールがあれば、翻訳工数マシになるかなと思いました。healthy_sato.icon
もし普及のボトルネックが膨大な工数であるなら、変換ツールによる工数削減は支援情報のSemantic Data化しやすくなりそうな気がします
ただ、それでも民間が保守運用(変換・調整・公開)し続けるのは工数的に厳しさはあると思います
でもデジタル庁的には、まずはCPSVから段階を踏んで、というお考えなのかな…?合意形成難しそうだし…
機械可読の動きをす進めるべきなのは当然として…healthy_sato.icon
各省庁や自治体の既存データをやさしい日本語に変換するツールを造ったら一時しのぎにはなってくれそうな気もします(役割としてはお悩みハンドブックに近くなりますね) とてもきになるhealthy_sato.icon
そこで大規模言語モデルを人間のサポートに使うのが適切な予感blu3mo.icon
確かに、一応表示することはかなり利益になりそうtkgshn.icon
@varunshenoy_: Can LLMs extract knowledge graphs from unstructured text? Introducing GraphGPT!
Pass in any text (summary of a movie, passage from Wikipedia, etc.) to generate a visualization of entities and their relationships.
A quick example:
GraphGPT、精神科のカルテや伴走型の相談支援などのCRMやSNSなどの投稿で既にデータが蓄積されていれば個々人の傾向が見えて改善に役立ちそうですねhealthy_sato.icon
関連