JSAI2026参加レポート

https://gyazo.com/1029c3281c87c3344c11a0de6cb5459b

2026/6/8〜6/12、人工知能学会全国大会（第40回）@Gメッセ群馬に5日間参加しましたmasaharu.icon

https://www.ai-gakkai.or.jp/jsai2026/

https://gyazo.com/149b41815a0b254b96f25fbca7b23098

masaharu.iconは今までは核融合系の学会にしか出たことがなかったので、他の学会に参加できたのは超新鮮でした

全体の印象

規模がでかい！

https://gyazo.com/4edab409278564bf6b23a876da9684c2

学会自体も5日間あるし、企業ブースも山ほどありました

学会にこんなに企業さん来るのかというのはmasaharu.iconにとっては衝撃でした

アカデミックな発表と民間企業の発表では特色が違うなぁという印象を持ちましたmasaharu.icon

アカデミックな発表は「新しい手法の探究」が主役で、提案手法がどれだけ既存より優れているかを示すことに力点が置かれると思います

一方で民間の発表は、既存の手法を実際のデータセットに当てはめてみたとか、実運用に乗せるまでに何が起きたかという報告が中心で、「より良いものが出たら乗り換える」というプラグマティックな姿勢を感じました

たとえば複数の発表で「VLLMはOCRより精度が出る」という比較結果が出ていましたが、それをそのまま「じゃあ置き換える」というような結論を見ました

アカデミックの文脈では手法の新規性が問われますが、民間では実運用に乗るかどうかが問われる。

この違いが面白いなぁっと思いましたmasaharu.icon

印象に残った発表

図表理解に基づく技術文書検索のためのRAGシステム（日立）

技術文書のRAGにおいて、ベクトル検索だけでは図表や仕様書の構造的な情報がうまく拾えないという問題に対し、LLMで文書を解析して構造化メタデータを生成し、それをDBに格納した上で検索するという手法の発表でした。

質問の分離 → 文章選択 → 関連箇所の特定 → 回答生成という4ステップの構成で、評価にはViDoRe Benchmarkを使いPrecision/Recall/F1/MRRで測定しています。

スキーマ設計が難しく、プロンプト設計は一旦自分でやってみてからagentic化した方が良かったという振り返りが印象的でした。同じ課題感を自分でも持っていたので、これは重要な発表だと思います。masaharu.icon

ちなみに同僚のdaiizさんもこの発表に興味を持っていたのが、ちょっと面白かったです

/daiiz/JSAI2026 図表理解に基づく技術文書検索のためのRAGシステム

やっぱりHelpfeel社員ですねmasaharu.icon

こーやって他の人のページをサクッと貼り付けられるのはcosenseの良いところmasaharu.icon

全研究室でcosenseを使うべきですmasaharu.icon

事業利用を目的としたファッション領域における視覚言語モデルの評価ベンチマークの設計と初期検討（ZOZO研究所）

タグ付け・品質判定・シーズン判定・素材判定というタスクに対して、社内データセットを使いVLMの評価ベンチマークを設計した発表です。「事業利用を目的とした」という前置きと、ベンチマークをちゃんと設計するという姿勢がまず誠実だと感じましたmasaharu.icon

「プロンプトを選ぶよりも、モデル選定が重要であることがわかった」と述べられており、これは重要な知見だとっと思っています

実運用でLLMを使い続けている身としては肌感覚としてわかってはいましたが、データとして示されると改めて重みがあります。

この前の「Model Routerを使った逐次LLM選択による毀損低減効果の検証」であったのですが、モデルが12ヶ月で入れ替わるという指摘を受けて、やはりzozoさんのようにベンチマークをちゃんと設計し運用することの大事さをひしひしと感じていますmasaharu.icon

企業内人材・スキル検索におけるナレッジグラフRAGの設計指針と有効性評価

組織統合によって「誰が何を知っているか」が見えなくなるという問題に対して、人・スキル・部署・業務・文書をナレッジグラフで構造化し、GraphRAGで検索する手法の発表でした

スキル表記揺れをWikipediaのリダイレクトで正規化するというアイデアが面白かったです

評価は100件を人力でgood/badを判定するという力技で、統計的有意性もしっかり示していました。

グラフ構築の段階で手動修正も入れたという話も含め、「ちゃんと動くものを作りきった」という密度がある発表でした。

そしてちゃんとグラフを作り切ったら軒並み精度が出たというのは説得力ありますねmasaharu.icon

機械学習時代からずーーーーと言われてますが、結局はデータセットゲーなのはLLM時代も同じですねmasaharu.icon

同じ発表を聴いていたdaiizさんのメモも参照。

/daiiz/JSAI2026 企業内人材・スキル検索におけるナレッジグラフRAGの設計指針と有効性評価

LLMのペルソナについて

実はHelpfeelでも、LLMにペルソナを与えるアプローチでPoCをやってみたことがあるのですが、想像以上に難しいことを痛感していましたmasaharu.icon

そんな中で聴いた「個別化と分布カバレッジによるLLMを用いた仮想個人の定量評価」では、その難しさが2つの軸で言語化されていました。

個別化：特定の人にどれだけ似せられるか

カバレッジ：母集団の分布をどれだけ再現できるか

自分がPoCで感じていた「なんかうまくいかない」という感覚が、この2軸できれいに整理されていてすっきりしました

結論としては「難しい」で、モデルサイズやReasoningを変えても改善しなかったという報告でしたが、むしろその正直さが価値のある発表だと思いました

個別化へのヒントとして面白かったのが、「LLMを用いたマルチドメイン行動ログの統合と行動予測」の発表です。

自分はこれまで「この人はこういうペルソナです」という属性の記述をプロンプトに渡すくらいしか考えていなかったのですが、実際の行動履歴を使う手法でないと精度が出ないという話を聞いて、なるほどと思いました。

「どんな人か」を言葉で説明するより「何をしてきたか」を渡す方が精度が上がるというのは、言われてみれば確かに、という話です。

40代女性

というようなペルソナはやっぱり無理があるmasaharu.icon

グルメ

https://gyazo.com/e240fcea71d271d34e81a2a0d4383735

学会にキッチンカーが来ていました

規模がでかいとキッチンカーが来るのかという衝撃masaharu.icon

うなぎおにぎりを食べました！

https://gyazo.com/8b017cce8a3fd4d27e4e25127d61d13c

daiizさんと新時代という居酒屋に飲みに行った時に食べた鶏皮です

安くておいしかったですmasaharu.icon

daiizさんとは、LLMの応用の話で盛り上がりました

今こそk-meansが熱いという話は最高に面白かったです

おわりに

JSAI2027はポスター発表で出たいmasaharu.icon

テーマはHelpfeelの検索アプローチを対象にして、LLMを用いた定量評価手法の提案と実験結果を考えています

これも学会に出たからこそ思いついたわけで、本当に学会に参加してよかったmasaharu.icon