Imagen - 基素基

Imagen

Submitted on 23 May 2022

Google Research Brain Teamは実装を公開していない

コミュニティの実装がある

https://gyazo.com/60aa829a4ec4758feae62ff1f531bda7

DALL·E 2よりCOCOデータセットでのFIDが良い

https://github.com/lucidrains/imagen-pytorch を使ってShadowverseのイラスト3500枚を学習

学習にRTX3090を使っても足りないので1回の超解像（収束していない）までの不完全版で実行。1週間。

paperではTPU 256枚で数日

解説

https://www.youtube.com/watch?v=N6lJvkoku9s