JSAI2026参加レポート
https://gyazo.com/1029c3281c87c3344c11a0de6cb5459b
2026/6/8〜6/12、人工知能学会全国大会(第40回)@Gメッセ群馬に5日間参加しましたmasaharu.icon
https://gyazo.com/149b41815a0b254b96f25fbca7b23098
masaharu.iconは今までは核融合系の学会にしか出たことがなかったので、他の学会に参加できたのは超新鮮でした
全体の印象
規模がでかい!
https://gyazo.com/4edab409278564bf6b23a876da9684c2
学会自体も5日間あるし、企業ブースも山ほどありました
学会にこんなに企業さん来るのかというのはmasaharu.iconにとっては衝撃でした
アカデミックな発表と民間企業の発表では特色が違うなぁという印象を持ちましたmasaharu.icon
アカデミックな発表は「新しい手法の探究」が主役で、提案手法がどれだけ既存より優れているかを示すことに力点が置かれると思います
一方で民間の発表は、既存の手法を実際のデータセットに当てはめてみたとか、実運用に乗せるまでに何が起きたかという報告が中心で、「より良いものが出たら乗り換える」というプラグマティックな姿勢を感じました
たとえば複数の発表で「VLLMはOCRより精度が出る」という比較結果が出ていましたが、それをそのまま「じゃあ置き換える」というような結論を見ました
アカデミックの文脈では手法の新規性が問われますが、民間では実運用に乗るかどうかが問われる。
この違いが面白いなぁっと思いましたmasaharu.icon
印象に残った発表
技術文書のRAGにおいて、ベクトル検索だけでは図表や仕様書の構造的な情報がうまく拾えないという問題に対し、LLMで文書を解析して構造化メタデータを生成し、それをDBに格納した上で検索するという手法の発表でした。
質問の分離 → 文章選択 → 関連箇所の特定 → 回答生成という4ステップの構成で、評価にはViDoRe Benchmarkを使いPrecision/Recall/F1/MRRで測定しています。
スキーマ設計が難しく、プロンプト設計は一旦自分でやってみてからagentic化した方が良かったという振り返りが印象的でした。同じ課題感を自分でも持っていたので、これは重要な発表だと思います。masaharu.icon
ちなみに同僚のdaiizさんもこの発表に興味を持っていたのが、ちょっと面白かったです
やっぱりHelpfeel社員ですねmasaharu.icon
こーやって他の人のページをサクッと貼り付けられるのはcosenseの良いところmasaharu.icon
全研究室でcosenseを使うべきですmasaharu.icon
タグ付け・品質判定・シーズン判定・素材判定というタスクに対して、社内データセットを使いVLMの評価ベンチマークを設計した発表です。「事業利用を目的とした」という前置きと、ベンチマークをちゃんと設計するという姿勢がまず誠実だと感じましたmasaharu.icon
「プロンプトを選ぶよりも、モデル選定が重要であることがわかった」と述べられており、これは重要な知見だとっと思っています
実運用でLLMを使い続けている身としては肌感覚としてわかってはいましたが、データとして示されると改めて重みがあります。
組織統合によって「誰が何を知っているか」が見えなくなるという問題に対して、人・スキル・部署・業務・文書をナレッジグラフで構造化し、GraphRAGで検索する手法の発表でした
スキル表記揺れをWikipediaのリダイレクトで正規化するというアイデアが面白かったです
評価は100件を人力でgood/badを判定するという力技で、統計的有意性もしっかり示していました。
グラフ構築の段階で手動修正も入れたという話も含め、「ちゃんと動くものを作りきった」という密度がある発表でした。
そしてちゃんとグラフを作り切ったら軒並み精度が出たというのは説得力ありますねmasaharu.icon
機械学習時代からずーーーーと言われてますが、結局はデータセットゲーなのはLLM時代も同じですねmasaharu.icon
同じ発表を聴いていたdaiizさんのメモも参照。
LLMのペルソナについて
実はHelpfeelでも、LLMにペルソナを与えるアプローチでPoCをやってみたことがあるのですが、想像以上に難しいことを痛感していましたmasaharu.icon
個別化:特定の人にどれだけ似せられるか
カバレッジ:母集団の分布をどれだけ再現できるか
自分がPoCで感じていた「なんかうまくいかない」という感覚が、この2軸できれいに整理されていてすっきりしました
結論としては「難しい」で、モデルサイズやReasoningを変えても改善しなかったという報告でしたが、むしろその正直さが価値のある発表だと思いました
自分はこれまで「この人はこういうペルソナです」という属性の記述をプロンプトに渡すくらいしか考えていなかったのですが、実際の行動履歴を使う手法でないと精度が出ないという話を聞いて、なるほどと思いました。
「どんな人か」を言葉で説明するより「何をしてきたか」を渡す方が精度が上がるというのは、言われてみれば確かに、という話です。
40代 女性
というようなペルソナはやっぱり無理があるmasaharu.icon
グルメ
https://gyazo.com/e240fcea71d271d34e81a2a0d4383735
学会にキッチンカーが来ていました
規模がでかいとキッチンカーが来るのかという衝撃masaharu.icon
うなぎおにぎりを食べました!
https://gyazo.com/8b017cce8a3fd4d27e4e25127d61d13c
daiizさんと新時代という居酒屋に飲みに行った時に食べた鶏皮です 安くておいしかったですmasaharu.icon
daiizさんとは、LLMの応用の話で盛り上がりました
今こそk-meansが熱いという話は最高に面白かったです
おわりに
JSAI2027はポスター発表で出たいmasaharu.icon
テーマはHelpfeelの検索アプローチを対象にして、LLMを用いた定量評価手法の提案と実験結果を考えています
これも学会に出たからこそ思いついたわけで、本当に学会に参加してよかったmasaharu.icon