世論地図2024振り返り
オープンデータREADME用の下書き
nishio 台湾のデジタル民主主義活動のvTaiwanなどで有名になったPolisの、日本での大規模実践事例(衆議院選挙で4000人以上の人に使ってもらった)「世論地図」の詳細を公開しました!英語での解説も近日中に公開する予定です! 世論地図とは
世論地図は日本のNPO法人Mielkaが2024-11-18にリリースしたサービスです。
Mielkaは2016年に設立されたNPO法人で、若者主導で政治を「見える化」し、日本の民主主義の発展を目指しています。
日本最大級の選挙情報サイトJAPAN CHOICEを2017年年から運営しており、2021年の衆議院選挙では160万人のユーザが利用しました。
世論地図は2024年衆議院選挙の期間中に各政党のマニフェストに書かれた個別イシュー対してユーザが匿名で投票することによって世論の分布を可視化するJAPAN CHOICEの実験的新機能としてリリースされた
約2週間の間に、ユニークユーザ4403名からの投票があった。このリポジトリはその投票データをオープンデータ化するためのものである。
https://gyazo.com/d7595b4a39368f9f25e68de0ebed574a
技術的詳細
このサービスはサーバサイドにColin Megill 氏を中心に開発された意見収集ツールPolisを用いている。このツールは台湾政府が市民参加型プロジェクト vTaiwan で採用したことで、その有用性が広く知られるようになった。
フロントエンドは日本の状況に合わせてフルスクラッチで再開発した。JAPAN CHOICEのアクセス解析により、300万ユニークユーザのユーザの85%がモバイル環境で選挙情報を確認していることが知られていた。そのため、スマートフォンでの狭い画面で利用可能にすることが必須の条件であった。
また追加機能として下記の二つが挙げられる
政党の意見を政党アイコンで可視化
LLMによるクラスタの解説
政党の意見を政党アイコンで可視化
世論地図では投票対象意見を各政党のマニフェストから抽出した。また、それぞれの政党がそれぞれの意見に対して賛成か反対か中立かをデータ化し、ユーザの意見分布に合わせて表示した。
https://gyazo.com/b6559660f0438f533d7b45f0ac2e4db4
LLMによるクラスタの解説
Polisのクラスタが意味することをデータ分析に慣れていない一般的なユーザは読み取りにくいことが懸念事項であった。
そこでPolisが抽出する「クラスタを特徴付ける意見」のデータをLLMに渡し、そのグループの人がどのような意見を持っているかを説明させた。また、それを一言にまとめてグループの名前を名付けさせ、それを散布図にも表示した。
https://gyazo.com/7235d2847d36e691d32a3fb02f6eaad4https://gyazo.com/fc670261b4570f11d66d57cbddf53a62
興味深い知見
政党が代表しない意見グループの存在
https://gyazo.com/e67a0d78d10544d8b61a0ace32624b06
この図は経済政策に関する意見集団の可視化である。右下に政党のアイコンがついていないクラスタがあることがわかる。つまりこのグループの意見は既存の政党によってあまり代表されていない、民意が国政に取り入れられていない状態であることが示唆される。このグループのAIによる解説は以下の通りである:
Team Yellow 価格転嫁慎重派
🤖このチームは中小企業の価格転嫁支援による賃上げ実現に対して、他のグループと比較して相対的に慎重な姿勢を示しています。また、消費税の引き下げや廃止に明確に反対しており、低所得者世帯への給付金支給にも懐疑的です。
投票数とクラスタ数の関係
今までのPolisの結果の観察から、時間経過で二つの自明な対立構造に収束する可能性が懸念されていた。これはデータが増えるに従って意見分布のPCA結果が一塊の明確な境界を持たない楕円に収束し、後段のk平均法によるクラスタリングで第一主成分軸方向に二分割するクラスタが選ばれてしまう現象である。
しかし今回の世論地図の実験では4400人の投票があってもクラスタが4つにわかれるケースが観察された。世論地図では投票対象の意見が政党のマニフェスト由来であるため、投票期間中に増加しない特徴がある。ここから、自明な対立構造に収束する問題は、ユーザ数の増加ではなく、投票対象意見の増加に伴う高次元化が原因であることが示唆される。
今回の実験では1時間ごとに統計情報を記録した。下記は投票ユーザ数とクラスタ数の関係である。最終的にクラスタ数が4に収束するまでに2500人程度のユーザが必要であったことがわかる。
https://gyazo.com/2f3c70f6cc66736bdcdac672ff08cedb
デジタル民主主義
各政党のマニフェストへの記載がまだ不十分なデジタル民主主義について、Mielka側が投票対象意見を設定した。この地図に関してはデータ不足で問題を起こさないように政党アイコンを表示しないことにした。
https://gyazo.com/11ecabc24900627ba68c458e1786e440
解説
Team Red 広告規制・AI懐疑派
🤖このチームは、インターネットのターゲット広告などへの規制を支持する一方で、AIによる政策決定や自動化に対しては慎重な姿勢を示しています。テクノロジーの利便性よりも、規制と慎重な導入を重視する立場が見られます。
Team Blue デジタル連携・効率化推進派
🤖このチームは、マイナンバーの活用による行政データの連携やオンライン化による効率化を強く支持しており、デジタル技術を用いた行政サービスの迅速化に重点を置いています。ウェアラブルカメラやAIの導入を進める姿勢も見られます。
Team Yellow AI活用・個別最適化派
🤖このチームは、AIを活用した政策決定の自動化や民意の可視化手段の推進に積極的です。また、個別の成績トラッキング強化など、AIを用いて個別化された対応や効率的な判断プロセスの実現を目指しています。
Team Green プライバシー保護派
🤖このチームは、自己情報のコントロール権の保護や欧州並みの個人情報保護法強化を支持しており、個人のプライバシー保護に強い関心を持っています。インターネット広告の規制も支持し、市民参加型の議題提案システムを通じた民主的な意思決定を志向しています。
未来のデジタル民主主義に向けての改善点
各政党のマニフェストから偏りがないように意見を抽出する作業は人間が行った。神経を使う大変な作業であった。この部分はLLMで支援できると良いが、ハルシネーションが起きた場合の影響が深刻なため慎重な実験が必要だ。デジタル民主主義についての世論地図にてLLMで生成する実験が行われたが、我々は十分な品質ではないと判断して使用しなかった。
選挙期間中にLLMのハルシネーションによって特定の政党に不利な誤情報が生まれることの懸念から、人間のレビューを経てから公開する形を取り、選挙期間中に3回の更新を行なった。これはPolisの持っていたリアルタイム更新の面白さを手放している。
特に「クラスタ内は70%賛成10%反対、クラスタ外は90%賛成3%反対」のような特徴に関して、このクラスタの特徴としては「反対が他より多いこと」であるが、数値の上では賛成が多数である。LLMはこのクラスタを「賛成が多い」と解説してしまう傾向が見られた。プロンプトに与えるデータの表現に工夫が必要である。
同様の理由から、ユーザによる意見の投稿も受け付けなかった。アジェンダ設定の権限を人々に開放することは達成したい理想であるが、特にリアルタイムで投稿を受付け反映することは、質の担保・誤情報対策・投票対象意見の増加に伴う高次元化の問題がある。今後さらなる研究が必要である。