Multimodal Emergent Fake News Detection via Meta Neural Process Networks

Yaqing Wang, Fenglong Ma, Haoyu Wang, Kishlay Jha and Jing Gao

Purdue University, West Lafayette, Indiana, USA

Pennsylvania State University, Pennsylvania, USA

University of Virginia, Charlottesville, Virginia, USA

選んだ理由

Fake News検出の精度感

現実的な手法を提案してるらしい

イントロ

Fake Newsは瞬く間に拡散されてしまうので、できるだけ早く検出したい

ニュースイベントのドメインシフトにより、過去のイベントでトレーニングされたモデルは満足のいくパフォーマンスを達成できない可能性

新規のNewsの知識を取り込めばよいが、モデルを最初から学習or追加学習は現実的には厳しい

また新規のNewsにはラベル付きデータが少ない(下図だと3データ)

この小さなデータでTargetがFakeか判定できるようにしたい

https://gyazo.com/e034b5017b8b0b5446d6723d82c49663

※

小さいデータセットといえば、few-shot learning!!

そのひとつの、meta learning

Fake Newsでは、その仮定(適用するタスクが多様でないこと)が効かない

そのひとつの、neural processes

underfittingしやすい。精度低め

本論文では、meta learningとneural processesを融合

これにより、互いの弱点を補う

オフライン実験にて、4~5%の精度向上

用語

few-shot learning

あとから少量のデータでチューニングしやすい基礎パラメータを学習することが目標

例えば、テストではライオンとトラの分類を行いたいが、ライオンとトラのラベル付き画像は多く集められず、イヌとネコならラベル付き画像を集めることができたとします。この場合、イヌとネコの画像で学習を行った後、ライオンとトラの画像を数枚(通常は3~5枚程度)だけ使ってライオンとトラの分類をできるようにモデルを適応させるのがfew-shot学習というものになります。https://www.skillupai.com/blog/tech/meta-learning-tips/

イベント

Newsのイベント（〇〇動物園からエミュー脱走）

dataset分割

support data : イベントeごとの教師データ

$ \left\{\mathbf{X}_{e}^{s}, \mathbf{Y}_{e}^{s}\right\}=\left\{x_{e, i}^{s}, y_{e, i}^{s}\right\}_{i=1}^{K}

query data : イベントeごとのチューニング用教師データ

$ \left\{\mathbf{X}_{e}^{q}, \mathbf{Y}_{e}^{q}\right\}=\left\{x_{e, i}^{q}, y_{e, i}^{q}\right\}_{i=K+1}^{N}