セマンティック通信

画像から意味情報を抽出して送信し, 受け手がLLMなどで再構成することで, 通信量を大幅に削減した送受信を実現する研究

再構成は必須なのか, よく分からない

応用例によっては不要そう. そもそも意味情報の抽出自体, 方法がたくさんある気がする

この応用例として, 通信リソースが貧弱な山間部などでの利用が示唆されていたが, どういう目的で画像を必要とするのか分からない

この論文は山間部などの話で以下の論文を引用している. 読んだら画像を必要とする理由が分かるのか?

これは総合的なサーベイらしいから, まだ触れるのは分かる

これはまず風力発電で, この時点で怪しい. 僕の知識では風力発電の電力供給は微々たるものだという認識

仮に異常検知系タスクであれば, 画像より赤外線とか, 最適な方法がありそうだが, どういう想定なのだろう

生育状況の監視はカメラ以外のセンサが有効そうだし, 動物の侵入検知も同様. 他に何があるのだろうか

チュートリアルの論文を読みたい. 今の理解だと, セマンティック通信は莫大なトラフィックの原因である動画の意味情報を抽出し, 再現性のない手法で再構成するので, 体験の保証ができないから筋が悪そう, と思ってしまう. 実際どうなのか?

これは娯楽領域, エンターティメントの視点が強いからそういう考えになっているかもしれない. Geminiに指摘されたが, 災害時などの緊急時や, 通信リソースに乏しいLPWNなどの場合, 情報の伝達そのものが重要であり, 多少画像や映像に差異が生じても, 中核の情報が伝われば問題ない

Geminiが提案した主要論文

理論の基礎

通信の三レベルを提唱

セマンティック通信を数学的に定義

意味のエントロピーを導入

実装の転換

Transformerを利用した, 画像の意味を抽出するフレームワークを提案

送信物にノイズなどが混じっても, 文全体の意味合いが通れば良いとする評価指標を導入

音声の再構成を行う. 正確な内容ではなく, 意味の伝達を重視

タスク指向通信: 体験の再現ではなく, 何らかの目的に沿った情報送信を行う

通信の評価を, 正しい内容を送信したかではなく, 受け手がより良い行動をとれたかで行うことを提案?

サーベイらしい. 意味的情報の送信では, 自動運転の実現を考える時, 情報全体の正しさを保証するのではなく, タスクの遂行に必要な情報を保証するよう, 送信を最適化する?

個人的に気になった論文

意味的なコミュニケーションが結局何を目指すのか, どういう形で行われるのか, というのを説明しているかも

エッジコンピューティングやTinyMLに興味があり, その文脈でセマンティック通信への興味が湧いてきた. それらを網羅的にサーベイしているのであれば, 今後のサーベイのため参考にしたい

一旦, 上の1~3を読むか

先に日本語のサーベイ論文を読む