生成モデル
機械学習の一種で、与えられた入力データに基づいて、新しいデータを生成することができるモデル
もともと識別モデルと対比して使われるようになった用語
生成モデルは、観測されたデータから潜在的なパターンや特徴を学習し、そのパターンや特徴を使用して、新しいデータを生成する
データの生成過程 (データ分布) を学習することを目的とする
データの生成は生成モデルの一側面に過ぎず、異常検知や欠損値補完、ノイズ除去、データ増強など様々な場面で利用できる
深層学習によるもの: 深層生成モデル (Deep Generative Model)
潜在変数: データの生成過程を説明する役割を果たす隠れた変数
例えば猫の写真であれば、猫の種類や写真の中での角度やポーズなど
代表的な生成モデルの例
オートエンコーダー (Autoencoder) : 入力データを符号化 (エンコード) し、それを元に復元 (デコード) することで、元のデータと似たような新しいデータを生成することができるモデル
潜在変数を含んだ生成モデルを学習する手法のひとつ
データを潜在空間に圧縮するエンコーダーと、潜在空間から元のデータを再構築するデコーダーから成る
ベイズ生成モデル (Bayesian Generative Models) : ベイズの定理に基づき新しいデータを生成することができるモデル
代表的なもの : Latent Dirichlet Allocation (LDA)、変分オートエンコーダ (Variational Autoencoder、VAE)
敵対的生成ネットワーク (Generative Adversarial Networks、GAN) : 2 つのネットワーク (生成ネットワークと判別ネットワーク) を競い合わせることで、新しいデータを生成することができるモデル
拡散モデル (Diffusion Model)
参考文献
AI 白書 2025