和田が読んだ論文リスト
*:研究室内で紹介
2024/09/05
1. 手続き的知識を用いた方法を表すクエリからの目的抽出*
URL:https://proceedings-of-deim.github.io/DEIM2023/3a-2-2.pdf
発表:DEIM2023
著者:工家昂之・山本岳洋(兵庫県立大学)、莊司慶行(青山学院大学)
手段を入力したときに目的を抽出するシステムの作成
目的から異なる手段を検索・提示することで視野狭窄を防ぐ
wikiHow()からデータセットを作成→ある程度手続的知識の学習が可能
関連:手続的知識、BERT2BERT、T5、MMR
2024/09/17
2. キーワードによる画像検索における画像内容に基づくマイナス検索*
URL:https://proceedings-of-deim.github.io/DEIM2023/3a-3-4.pdf
発表:DEIM2023
著者:吉川英作・田島敬史(京都大学大学院情報学研究科)
画像のマイナス検索の精度の向上
コンテンツベースによる検索
クエリ「A -B」で除去されるべき画像を「A&B」で検索
関連:VGG16、Res-Net-50、ImageNet、大津の2値化
2024/09/20
3. BERTとPANNsを用いた文脈を考慮した効果音検索*
URL:https://proceedings-of-deim.github.io/DEIM2022/papers/C21-1.pdf
発表:DEIM2022
著者:奥田萌莉・大島裕明(兵庫県立大学)
小説の文章を基に効果音を検索
ベクトルを用いて、小説の文と効果音の説明文の類似度・感情の一致度を計算
テキスト類似度による効果音検索では一定の精度を示した
関連:SERIES 6000 THE GENERAL、WRIMEデータセット、AudioSet
2024/09/27
4. 3Dモデルを利用したユーザーの求めるアングル画像の検索システムの開発*
URL:https://confit.atlas.jp/guide/event/deim2024/subject/T3-B-4-05/detail?lang=ja
発表:DEIM2024
著者:永田 玄・常 穹・宮崎 純(東京工業大学情報理工学院)
画像を入力として、角度違いの画像を検索
Wonder3Dを使った3Dモデルの推定、CDを用いた特徴量マッチング→先行研究よりは高精度な角度違いの画像検索が可能
関連:Wonder3D、Occupancy Network、Front2Back、CD (Chamfer Distance)、PHF (point feature histograms)、GIST特徴量
2024/10/03
5.食品レビューでのクエリ拡張のためのLLMを用いた動議フレーズ作成
URL:https://confit.atlas.jp/guide/event-img/deim2024/T3-A-4-04/public/pdf?type=in
発表:DEIM2024
著者:芦澤 亜里紗・三林 亮太・大島 裕明(兵庫県立大学)
レビューにおける表現の同義性を考慮した検索
BERTを基にした検索モデルで入力に関するレビューをランキングで表示
LLMによってオンデマンドに同義フレーズを取得し、それを基に検索
TF-IDFやOkapiBM25より提案手法のほうがnDCG@10で高いスコアを獲得
関連:BERT、LLM
2024/10/04
6.繰り返し聴取による興味の変化を考慮した楽曲推薦*
https://confit.atlas.jp/guide/event-img/deim2024/T3-B-8-03/public/pdf?type=in
発表:DEIM2024
著者:重富竜ノ介(九州大学大学院芸術工学府)、西田紘子・ 澤井賢一・牛尼剛聡(九州大学大学院芸術工学研究院)
ユーザが音楽を繰り返し聞くパターンを学習し、ユーザの楽曲に対する興味をより反映させた楽曲推薦
QKV自己注意機構にユーザが楽曲を繰り返し聞いた回数も異なるQueryとKeyとして埋め込む
関連:Self-Attention Network、(QKV自己注意機構)
2024/10/06
7.Twitterデータを活用したラジオ番組推薦システムの検討*
URL:https://proceedings-of-deim.github.io/DEIM2023/3b-7-1.pdf
発表:DEIM2023
著者:丸山司・岡本一志(電気通信大学情報理工学研究科)、柴田淳司(東京都立産業技術大学院大学)
ソーシャルメディアのデータを用いた推薦手法のうち、ラジオ番組推薦に適した手法を明らかにする
2024/10/11
8.料理のアレンジに着目したレシピへのメタデータ付与手法*
URL:https://proceedings-of-deim.github.io/DEIM2020/papers/P1-5.pdf
発表:DEIM2020
著者:山本 啓太・那須日向太(和歌山大学システム工学部システム工学科)、風間 一洋(和歌山大学大学院システム工学研究科)
一般的なレシピと比較し、アレンジされているレシピのアレンジ部分を既知のラベルとしてラベル付け
関連:クックパッドデータセット、Bow (Bag of Words) ベクトル
SVM (Support Vector Machine)、決定木(分類木)
2024/10/22
9.Attention Is All You Need*
発表:NIPS 2017
著者:Ashish Vaswani・Noam Shazeer・ Niki Parmar,・Jakob Uszkoreit・ Llion Jones (Google), Aidan N.Gomez(トロント大), Łukasz Kaiser(Google), Illia Polosukhin
RNNを使わない注意機構で構成されたシーケンシャルモデルの提案
Self-Attention(自己注意機構):1つの文の中でどんなことに関係するか
Scaled Dot-Product Attention(縮小付き内積自己注意)
QVK Attention:Q(Query)を使って似ているK(Key)を探し、紐づけられているV(Value)で類似度を判断
Multi-Head Attention:Scaled Dot-Product Attentionを複数回実施
1回実行(Head)を複数回実施
Masked Multi-Head Attention:デコーダで後の単語が影響しないようマスクする
その単語より後の単語に-∞をかける
入力のEmbedding
各トークンを512次元で埋め込み
トークナイゼーション:サブワードを利用
Positional Encording(位置情報の埋め込み)
Multi-Head Attentionは単語の位置を考慮できない
単純に数字を割り振るだけだと数が大きくなってしまう…
→sinにすると取りうる範囲が-1~1になる
→入力となるトークンの数では同じ値が出てこないくらい周期が大きいsinを用いる
→最初の方の変化が少ないため、sinとcosの両方を用いる
残差接続:精度向上
関連:QKV Attention、Self-Attention、サブワード、Word-peice、Byte-Pair Encording
2024/10/29
10.LEARNING AUDIO EMBEDDINGS WITH USER LISTENING DATA FOR CONTENT-BASED MUSIC RECOMMENDATION*
DOI: 10.1109/ICASSP39728.2021.9414458
発表:ICASSP 2021
著者:Ke Chen(カルフォルニア大学/米)、Beici Liang・Xiaoshuan Ma・Minwei Gu(QQ Music/中)
大規模なデータセットでユーザーの埋め込みと曲の埋め込みを実装
距離学習による曲の埋め込み表現
関連:YouTubeDNN、log-melスペクトル
2024/11/05
11.RULKKG:Estimating User’s Knowledge Gain in Search-as-Learning Using Knowledge Graphs*
DOI:10.1145/3627508.3638331
発表:CHIIR 2024
著者:Hadi Nasser, Dima El Zein, Célia da Costa Pereira, Cathy Escazut, Andrea G.B. Tettamanzi (コート・ダジュール大学/仏)
Sarch as Learningにおいてユーザの知識の習得度をナレッジグラフを用いて推定
ナレッジグラフの類似度比較として3つの手法
ナレッジグラフ 、Maximum common subgraph、WebJaccad
2024/11/12
12.Transformers Meet ACT-R:Repeat-Aware and Sequential Listening Session Recommendation*
DOI:10.1145/3640457.3688139
発表:RecSys2024
著者:Viet-Anh Tran, Guillaume Salha-Galvan,Bruno Sguerra, Romain Hennequin(Deezer Research/仏/音楽ストリーミングサービスを提供)
ACT-R(人の認知科学のアーキテクチャ)を組み込んだ楽曲のシーケンス推薦モデルの提案
ACT-Rを使った楽曲Embedding
ACT-Rと注意機構を使ったユーザEmbedding
関連:ACT-R、Transformer、Last.fm、Deezer、認知科学
2024/11/29
13.CriTrainer: An Adaptive Training Tool for Critical Paper Reading*
DOI:10.1145/3586183.3606816
著者:
発表:UIST 2023
「論文を批判的に読むスキル」を習得するための訓練ツール「CriTrainer」の開発・評価
批判的な読解のツールに求められる要件の調査・精査
読解トレーニングにおいて用いられる「QRACプロセス」を応用した「QR2ACプロセス」を利用
QR(Question&Reading):読み込む支援
質問が提示、答えを探しながら読む
AC(Anser&Check)-1:要点を理解する支援
要約をする
AC-2:深く考える支援
クリティカルシンキングの質問を考える
関連:QRACプロセス
2024/12/13
14.Enhancing credibility judgment of web search results*
DOI:10.1145/1978942.1979126
著者:Yusuke Yamamoto, Katsumi Tanaka(JSPS Research Fellow [ 日本学術振興会特別研究員 ]・京都大学)
発表:CHI2011
Web検索で信頼性が高い情報を効率的に見つけるための支援システムの提案
信頼性の判断に必要な要因を可視化(レーダーチャート)
正確性、客観性、(ページ作成者の)権威性、最新性、網羅性
ユーザがどのように信頼性を判断しているかモデルを予測
予測されたモデルによる検索結果のリランキング
提案手法:Googleの検索結果一覧の表示のみより信頼性が高いWebページを多く見つけられた
検索トピックに精通しているユーザが特に提案手法が有効
関連:ページランクアルゴリズム、Lex Rankアルゴリズム、はてなブックマーク、Wayback Machine
2025/02/07
15.ChatGPT vs. Google: A Comparative Study of Search Performance and UserExperience*
DOI:10.48550/arXiv.2307.01135 (CISTとしては出版されていない?)
著者:Ruiyun (Rayna) Xu, Yue (Katherine) Feng, Hailiang Chen(マイアミ大学(米)、香港理工大学、香港大学)
発表:CIST2023
ChatGPTをGoogle検索のような従来の検索エンジンと体系的に比較した最初の実証研究
情報検索タスクで検索エンジン(Google)とチャットボットツール(ChatGPT)を使ったときのパフォーマンス・ユーザ行動の違いを調査
ChatGPT
全てのタスク:時間が短かった
学歴によらずユーザの検索能力を平均化
パフォーマンス:タスクによって異なる
得意なタスク:率直な質問の回答、一般的な解決策
不得意なタスク:事実確認
ユーザエクスペリエンス:有用性・楽しさ・満足度〇
関連:ChatGPT、Google
2025/03/11
16.Next Point-of-Interest Recommendation with Inferring Multi-step
DOI:10.24963/ijcai.2022/521
著者:Lu Zhang, Zhu Sun , Ziqing Wu , Jie Zhang , Yew Soon Ong, Xinghua Qu (ナンヤン工科大学、A*STAR Institute of High Performance Computing、A*STAR Centre for Frontier AI Research、Bytedance AI Lab(シンガポール))
発表:IJCAI2022
ユーザが未来に訪問するPOIを予測することでユーザが次に訪れるPOIを推薦
ユーザのPOIの訪問履歴からベクトルをEnbedding、Transformerで前後の関係性を考慮した過去の訪問履歴ベクトルを作成
ユーザの最新日のPOIの訪問履歴からベクトルをEnbedding、LSTMで現在の訪問履歴ベクトルを作成
過去の訪問履歴ベクトルから未来の1日分の訪問予測ベクトルを作成
現在の訪問履歴ベクトルと未来の1日分の訪問予測ベクトルからユーザが次に訪問するPOIを表すベクトルを作成、次に訪問するPOIのベクトルを出力
関連:POI、POI推薦、ユーザモデリング
2025/05/23
17.Information Foraging
DOI:10.1037/0033-295X.106.4.643
著者:Peter Pirolli, Stuart Card(Xerox Palo Alto Research Center)
発表:Psychological Review (1999)
情報採餌(情報の探索)も食物採餌と同じような枠組みで考えれる
食物採餌(動物が餌を探す行動)は最適採餌理論で説明されている
3つモデルを発展した分析
情報パッチモデル
情報がクラスター状に分布している環境においての情報採餌行動についてのモデル
強化活動:情報パッチや環境を改善することで情報獲得の収益性を高める
情報の匂い(Information Scent)モデル
手がかり(スニペットやアイコンなど)を基に、情報の価値を判別するモデル
活性化拡散理論に基づいている
情報の食餌(Information Diet)モデル
どのアイテムを選び、深堀するか判断するモデル
単位コストあたりのエネルギー利得を最適化するような食餌を行う
ACT-Rを情報採餌に応用したACT-IFの提案
関連:最適採餌理論(optimal foraging theory)、チェルノフの限界値定理(Charnov's Marginal Value Theorem)、Scatter/Gatherインタフェース、活性化拡散、ACT-R、Text REtrieval Conference (TREC)
2025/06/11
18.A New Era of Online Search? A Large-Scale Study of User Behavior and Personal Preferences during Practical Search Tasks with Generative AI versus Traditional Search Engines
DOI:10.1145/3706599.3720123
著者:Carolin Kaiser・Jakob Kaiser・Rene Schallner・ Sabrina Schneider(Nuremberg Institute for Market Decisions[独]・Management Center Innsbruck[豪])
発表:CHI EA 2025
生成AIチャットボットがユーザの行動・体験に与える影響を大規模な実験で調査・分析
タスク
割り当てられた検索ツール(ChatGPT or Google)と外部のWebサイトで情報収集
3択から条件に当てはまるもの1つを選ぶ意思決定を行う
性格特性についてのアンケートに答える(Big Five Inventoryを利用)
知見
ChatGPTでは迅速で正確な検索が可能(今回のトピック)
ChatGPT利用者は訪問するWebサイトが少ない(全く訪問しなかったユーザ:87.8%)
外向性・協調性などが高い人→ChatGPTを利用したい傾向
神経質性が高い人→ChatGPTを利用したくない傾向
今後:より広い範囲の情報を統合する複雑・オープンエンドな検索タスクでも検証が必要
関連:検索エンジン、LLM、情報探索、Big Five Inventory
2025/06/20
19.Search+Chat: Integrating Search and GenAI to Support Users with Learning-oriented Search Tasks
DOI:10.1145/3698204.3716446
著者:Yuyu Yang, Kelsey Urgo, Jaime Arguello, Robert Capra(University of North Carolina at Chapel Hill・University of San Francisco)
発表:CHIIR 2025
情報検索タスク(学習指向のタスク)において、伝統的な検索システムと生成型AIを統合について調査・分析
(条件1)標準的なWeb検索システムと(条件2)標準的なWeb検索+GenAIベースのチャットの2条件で比較
条件2の参加者
検索インタフェースに費やす時間>文書を読む時間、ウェブ検索コンポーネントの関与は少なかった
学習成果は検索タスク直後は大きく改善した
チャットに具体的な質問を投げかけ、検索を回避し理解しやすい情報を得て時間と労力を節約した
各コンポーネント(Web検索・AIチャット)に対して異なる種類のクエリを使用
AIチャットから返された情報に対する信頼度はWebコンポーネントより低い
2025/07/11
20.CoSearchAgent: A Lightweight Collaborative Search Agent with Large Language Models
DOI:10.1145/3626772.3657672
著者:Peiyuan Gong, Jiamian Li, Jiaxin Mao(中国人民大学)
発表:SIGIR 2024(ショート)
Slackでの会話に協調検索を支援するボットの統合
協調検索では多くの人が親しみのない独自のツールが開発されることが多い
結果、検索エンジンで検索をして、チャットツールなどで共有することが多い
Slackに協調検索を行うボットを統合することで協調検索を支援
手法・実装
ユーザに呼び出されると、ユーザの要望に答える回答を参照元のリンク付きで生成
ボットが呼び出されると、会話の文脈(直前20文)からクエリ(ユーザの要望)を構成
クエリの明確化のための質問を生成し、質問を明確化する
Webで10件の関連結果を取得し、「urlークエリと関連する部分の要約」のペアを作成
要約を用いてクエリの回答を生成
(各部分で5-shotを用いている)
オープンソースで公開されており、協調検索タスクの分析やユーザ行動ログの取得が可能
2025/07/24
21.Serendipity as an emerging design principle of the infosphere: challenges and opportunities
DOI:10.1007/s10676-018-9496-y
著者:Urbano Reviglio(ボローニャ大学〔伊〕)
発表:Ethics and Information Technology (2019)
デジタル環境におけるセレンディピティについて分析・考察を行っている
セレンディピティは「個人がアイデア、情報、物体、または現象と価値あるかかわりを持つことで引き起こされる予期せぬ経験」と定義されることが多い
セレンディピティ的な出会いは、大きく3つのタイプに一般化できる(McCay-Peet & Toms 2017)
Type A:観察から解決へのタイプ
特に何かの情報を探していないときに起こる
SNSで何となくスクロールしている時など
Type B:ある問題Aから、別の問題Bへの解決に至るタイプ
ある特定の問題について情報を探しているときに、それとは異なるが未解決だった別の問題の解決を見つける場合
Type C:予期しない解決(擬似セレンディピティ)
目的を持って情報を探しているときに、無関係で予期しなかった情報を偶然発見する場合
パーソナライズによってエコーチェンバーやフィルターバブルの問題が起きている
セレンディピティによってそれらを緩和できる可能性
セレンディピティをプログラム(制御)する=セレンディピティでないという見方もある
セレンディピティの基準は主観的
レコメンドシステムは「セレンディピティ」より「精度」を重視している
トレードオフの関係
2025/07/30
22.Building Better AI Agents: A Provocation on the Utilisation of Persona in LLM-based Conversational Agents
DOI:10.1145/3640794.3665887
著者:Guangzhi Sun(ケンブリッジ大), Xiao Zhan・Jose Such(キングス・カレッジ・ロンドン / バレンシア・ポリテクニク大学〔西〕)
発表:CUI 2024 EA
対話型エージェント(CA)に独自のパーソナリティを付与する理由と影響を分析
利点
LLMを用いてユーザをシミュレートし、ユーザ実験が可能
学生や被介護者をシミュレートすることで、教師などの振舞い方の訓練が可能
企業などのサービスでユーザのエンゲージメントの増加
課題
ペルソナを一貫した回答は困難
キャラクターは、そのアイデンティティに一致した専門知識が必要
2025/07/30
23.See Widely, Think Wisely: Toward Designing a Generative Multi-agent System to Burst Filter Bubbles
DOI:10.1145/3613904.3642545
著者: Yu Zhang, Jingwei Sun, Li Feng, Cen Yao, Mingming Fan, Liuxin Zhang, Qianying Wang, Xin Geng, Yong Rui(東南大学、香港科技大学、Lenovo Research)
発表:CHI 2024 (Research-Article)
AIを活用した検索・推薦システムの普及:フィルターバブルの形成を加速→過去の研究ではユーザーが積極的に関与する動機付けが不足
人間中心のアプローチを採用、大規模言語モデル(LLM)がユーザーが多様な視点を受け入れるのを支援する方法を検討
ソーシャルメディアコンテンツを読む際にユーザーがインタラクションできるLLMを活用したマルチエージェントキャラクターを搭載したプロトタイプを開発
RQと検証
単に多様な視点を提示するのではなく、ユーザーが自身の枠組みを超えた思考を促すことを目的とした、 LLM を活用したシステムをどのように設計すべきか
主要なデザイン考慮点:多様な視点の提供、意図的かつ批判的な思考の促進、ユーザーエンゲージメントの動機付け
LLM(大規模言語モデル)を活用したマルチエージェントキャラクター、摩擦のない段階的なインタラクションフロー、ゲーミフィケーションデザインを組み込んだインタラクション機能を設計
→ユーザーが対立する見解と関わる動機付けになる
そのようなシステムがユーザーが多様な情報にアクセスし、それについて熟考するのに役立つかどうか、そしてどのように役立つのか
ユーザ実験:「退職政策」というテーマの投稿を閲覧し、ウェブアプリケーションとして展開されたシステムを使用してAIエージェントとコミュニケーションを取る
→評価タスクを伴う段階的なインタラクションが、慎重な検討を促進する可能性
2025/07/30
24.Conversational Argument Search Under Selective Exposure: Strategies for Balanced Perspective Access
DOI:10.1145/3726302.3730175
著者: Kyusik Kim, Jeongwoo Ryu, Dongseok Heo, Hyungwoo Song, Changhoon Oh, Bongwon Suh(ソウル大学校・延世大学校〔韓〕)
発表:SIGIR'25 (ショート)
対話型検索システムにおける議論検索は、選択的露出のリスクが高い
提案
1. 視点の提示を構造化するマルチエージェントフレームワーク
各エージェントが異なる立場を持つ
→より広範な視点の比較を促進
2. より深い関与を促す質問の提示
ユーザにオープンエンドの質問(「どう思いますか?」など)を提示し、議論について反射的に考えるよう促す
→エージェント発の質問はより深い内省を促す
評価:2×2要因のユーザスタディで開放性と批判的思考を評価
開放性:ユーザの初期の立場に反対する立場検討する意欲(独断主義、事実抵抗、自由主義を評価するActively Open-Minded Thinking(AOT)尺度を使用)
批判的思考:対立する見解をナビゲートし、偏った推論を軽減する(分析、推論、自己規制に焦点を当てたCritical Thinking Self-Assessment Scale (CTSAS) を使用)
2025/09/02
25. Critical Thinking: A Literature Review
2025/09/18
26. Enhancing Critical Thinking in Generative AI Search with Metacognitive Prompts
2025/10/09
27. Timing of Aspect Suggestion to Encourage Diverse Information Acquisition in Spoken Conversational Search
DOI:10.1145/3673791.3698418
著者: Ken Tobioka, Takehiro Yamamoto, Hiroaki Ohshima(兵庫県立大)
発表:SIGIR-AP'24
音声対話型検索
ユーザとシステムのやり取りが音声のみで行われる検索
多様な情報獲得:「アスペクト提案」(システムが次に何を検索すべきかを提案)が不可欠
提案のタイミングが参加者のクエリ行動に影響を与えるかどうかを調査
実験
各トピックに関連し多様なアスペクトを考慮した情報を検索し、得られた情報を要約するタスク(ウィザード法)
各参加者が全ての実験条件を体験(N=27)
3システムを比較
アスペクト提案なし
即時アスペクト提案:参加者のクエリ応答直後に提案
遅延アスペクト提案:ユーザが新たなクエリ作成に困難を生じた際に提案
ビデオカメラで研究者が確認
結果
RQ1:アスペクト提案の貢献度
アスペクト想起率(Sakai and Song)
$ AspectRecall = \frac{システムが回答したアスペクト数}{想定していたアスペクト数}
非提案<即時アスペクト提案<遅延アスペクト提案
RQ2:クエリ行動への影響
遅延型提案は即時型に比べ、より多くの自発的クエリ構築を促進
ドメイン知識やクエリのアイデアが不足している場合、参加者は即時アスペクト提案を好む傾向
アンケート
多様な情報を収集できたと感じたか
ユーザがシステムを多様な情報取得に有用と感じたか
ユーザが意見をまとめるのに十分な情報を収集できたか
それぞれ、提案なし<即時提案、提案なし<遅延提案
参考:Tukey HSD検定を使用
#wada