地理空間情報と自然言語処理 総合討論
冒頭
カバレッジが低い
企業と比べるとモチベーションが違う
OpenStreetMapも企業がスポンサーしている事例があるyuiseki.icon
日本でもそういう流れを作ってはどうか
科研費でもOpenStreetMap使ってる
国立国語研究所
古典のコーパス
歴史地名データ
地図上に古典をマッピングするといったことが可能になるはず
音声はどうか?
明治のころの音声は残っている
落語のSP盤
平安時代に宣教師がアルファベットで書いた資料
地名の読みに関する情報はあるか?
読みを再現しようとしている
逆に同じ地名なのにいろんな書き方をしている
正規化されていない
朝日新聞社
地理空間に言語情報をマッピングする
地理情報に結びついているテキストデータが少ない
世論調査のデータを使っているが、オープンにできない
Instagramの投稿を分析しようとしている
位置情報がプライバシー問題で取れなかったりする
→テキスト×画像×位置情報のマルチモーダル処理
ジオコーディングAPIに投げる前にデータクレンジングすると精度上げられる
生態学でもジオコーディングの課題がある
国土地理院の公開資料
PDFをパースしないといけない
表記ゆれが結構ある
一部が画像だったりする
レポーティングバイアス
レストラン情報は批判的な人が多い
→インターネット上にある情報は偏っている。地理情報に限らない
バイアス修正のテクノロジーに取り組む
注意書きをする
地図をベクトルにしてNLPと同じ手法で解きたい
グラフニューラルネットワーク
POIをベクトルに変換して扱うという研究はWWWであった
POI同士の近接関係
Text Feature
yuiseki.icon
地図を画像として扱ってVQAタスクを解く研究に取り組んでいる方はいますか?
地図を作成する際に言語処理や大規模言語モデルを活用している研究事例はありますか?
地図記号もテキスト情報?
絵文字もテキスト情報?
:1: 地理と言語の融合タスクについて
地理と言語の融合タスクとしてどのようなタスク(問題)があるか/解けると嬉しいか?
大規模言語モデル(ChatGPTなど)の活用によって、地理と言語の領域でどのような面白いことができそうか?
:2: 言語の人が地理空間を扱う上で直面する問題について
どのような地理空間の情報(知識)やデータ、ツールを欲しているか?
地理空間を扱う上でどのような問題や面倒に直面しているか?
:3: 地理の人と言語の人の情報共有について
地理(地理空間情報、地理に関連する諸分野)と言語(自然言語処理、言語学)の間で、どのような情報を共有すると有益か?
地理と言語に関心のある人たちでどういった情報共有方法(SlackやDiscordなどツール含む)がやりやすいか?