記号創発ロボティクスにおける主なモデル(内的表象形成)

深層学習の発展に伴い、表現学習の領域では大きな進歩が見られています。

特に、生の画像や音声といった感覚情報から有意義な特徴を抽出し、

それを用いてデータの背後にある構造やパターンを学習することが可能に。

このプロセスは、データの理解や将来の予測に直接役立つ内的表象を形成することつながる。

さらに、時間方向のダイナミクスを加えた世界モデルへと発展

自己符号化変分ベイズ（Auto-encoding variational Bayes）は確率的生成モデルの枠組みに基づきながら，ニューラルネットワークのような複雑な構造を持つ生成過程に対するベイズ推論を可能にした．

VAE（変分オートエンコーダ，Variational autoencoder）

深層学習で発展した生の画像や音声データからの特徴表現学習と内的表象学習を一体化させた議論が可能となった．

自己符号化変分ベイズ（Auto-encoding Variational Bayes、以下AVB）

このような表現学習を可能にする確率的生成モデルの一つ

データの生成過程をモデル化し、データがどのように生成されたかの確率的な推論を可能にする

データの背後にある潜在的な因子や構造を把握することができる

変分オートエンコーダ（VAE）

AVBの枠組みを実装した代表的なモデル。

入力データを低次元の潜在空間にエンコードし、

その潜在表現から元のデータを再構築（デコード）するニューラルネットワーク

この過程で、VAEはデータの背後にある潜在的な因子を学習し、それに基づいて新たなデータを生成することができる。

異なる種類の感覚情報（視覚と聴覚等）を同時に扱うことができるVAEの拡張版。

マルチモーダルデータから潜在表現を学習する

異なるモダリティ間の関係性や共通の構造を捉えることが可能に。