生成モデルは不可逆圧縮
誤解を招く
従来の圧縮技術(劣化JPGなど)とは比べものにならない圧縮がかけられている&一枚ごとの画像を分離して取り出したりはできないため、既存技術の認識で「不可逆圧縮」「解凍」という認識は正しくない。
→ 画像生成は超圧縮技術
関連
AIの学習は実際には不可逆圧縮なので、「AIの学習は人間の学習と異なる」
人間の学習の仕組みも不可逆圧縮とみなすことができる。
AIモデルから元画像を復元できることを指して非可逆圧縮と呼ぶことがある
学習元画像とほぼ同じ画像を生成
元画像に類似した画像を一枚でも作れるので画像生成AIはコピー
狙ったプロンプト、狙った画像で100万分の1程度の成功率
一般的には特定の画像を復元することはできないので、不可逆圧縮、非可逆圧縮は言葉足らずである。
参考
OSAWA, Hirotaka/ 日本SF作家クラブ第21代会長/ 💙💛
@hiroosa
私は最後に
・SF界は十年以上前からAI研究に親和的であったが、現在そのために生成AI利用の作品を海外に出せない作家がいること
・AIの「学習」は誤解を招く言葉で、テッド・チャンの主張通り、不可逆圧縮と同じではないか。法の仮定に技術が追いつけてないのでは
という質問をしました
午後7:06 · 2023年6月7日
https://twitter.com/hiroosa/status/1666386103400800260
鐘の音(除夜の鐘)ダイエット中−30kg
@kanenooto7248
「事実上学習と言われてる行為はただの不可逆圧縮である、要するにそれと区別つかないものを学習と呼んでいることによって問題が生じる」まあそうなんだけど、AI学習を人間の学習と一緒という人は、そこの欺瞞を解決できないんだよな。
午後6:39 · 2023年6月8日
https://twitter.com/kanenooto7248/status/1666741701158006791
neonuc2001
@NeoNuc2001
データセットそのものを不可逆圧縮したっていう考えはあながち間違いではないと思う。情報量は落ちてもデータセットの中身に近い内容を出力することは不可能ではない。
ただこれが人間の学習と何が違うのか、AI技術の利用になにけ影響を与えるのかっていうのが不透明に感じる
午後1:11 · 2023年6月9日
https://twitter.com/NeoNuc2001/status/1667021557963841536
neonuc2001
@NeoNuc2001
「AI学習とはすなわち不可逆圧縮である」という言説を見て考えるのは
・人間は記憶という形で受け取った情報を不可逆圧縮してるのではないか?
・それを元に人間は行動や生成(分けてはいるけど文脈上同じ)してるのではないか?
って考えちゃう。結局どこまで行ってもAIと人間のそれに違いはなさそう
午前10:54 · 2023年6月9日
https://twitter.com/NeoNuc2001/status/1666987004515737600