XVerse
https://gyazo.com/3827d6e6efbe871835068033374eef06
https://bytedance.github.io/XVerse/Project
https://github.com/bytedance/XVerse?tab=readme-ov-filebytedance/XVerse
https://huggingface.co/ByteDance/XVerseByteDance/XVerse
https://arxiv.org/abs/2506.21416XVerse: Consistent Multi-Subject Control of Identity and Semantic Attributes via DiT Modulation
Subject-Driven Image Generation
https://gyazo.com/ed1fe56fd804b0d0c56acf9a635adebe
XVerse: DiT変調によるアイデンティティと意味属性の一貫したマルチサブジェクト制御
このリポジトリには、論文「XVerse: DiT 変調によるアイデンティティと意味属性の一貫したマルチサブジェクト制御」の公式モデルが含まれています。
導入
XVerseは、複数被写体の画像合成に新たなアプローチを導入し、画像全体の潜在情報や特徴を損なうことなく、個々の被写体を正確かつ独立して制御することを可能にします。これは、参照画像をトークン固有のテキストストリーム変調のためのオフセットに変換することで実現します。
このイノベーションにより、個々の被写体の特性(アイデンティティ)とその意味的属性の両方を堅牢に制御できる、高忠実度で編集可能な画像生成が可能になります。XVerseは、パーソナライズされた複雑なシーン生成機能を大幅に強化します。
関連
DreamO