CoSeR
https://gyazo.com/e7f327a7a7e9b398a168d2813a219d60
https://coser-main.github.io/?ref=aiartweeklyProject
https://github.com/VINHYU/CoSeRVINHYU/CoSeR
https://arxiv.org/abs/2311.16512CoSeR: Bridging Image and Language for Cognitive Super-Resolution
https://gyazo.com/5d8879812703818c3a7ff230a16f848d
LR画像 = 入力画像(低解像度画像)
LR画像からCognitive EmbeddingとStable Diffusionを使って参照画像を作る
Cognitive Encoder
LR入力からCognitive Embeddingを抽出する
画像特徴量
All-in-Attention Module(AiA Module)
従来の条件生成手法とは異なり、超解像では出力とLR入力との間に高い忠実性を確保する必要があります。
そのため、我々は、Cognitive Embedding、参照画像、LR入力という3つの条件情報をすべて注意機構によって統合する
アップスケーラー