PromptEnhancer
https://hunyuan-promptenhancer.github.io/Project
https://www.arxiv.org/abs/2509.04545PromptEnhancer: A Simple Approach to Enhance Text-to-Image Models via Chain-of-Thought Prompt Rewriting
https://huggingface.co/tencent/HunyuanImage-2.1/tree/main/reprompttencent/HunyuanImage-2.1/reprompt
ユーザーが入力したテキストプロンプトを画像生成AIが理解しやすいように書き直す
Hunyuan-7B-Instructベース
https://gyazo.com/38144806d0a33854b939dadb3b04bcf3
Stage 1
CoT Rewriterは、最初に SFT on (ユーザープロンプト、再プロンプト) ペアを介して初期化されます。この段階では、標準的な次のトークン予測損失を使用して構造化された思考連鎖スタイルの応答を生成するようにモデルに教え、改良のための強力な基盤を確立します。
Stage 2
CoT Rewriterが生成したプロンプトでHunyuanImage 2.1が画像生成、その画像と参照プロンプトをAlign Evaluatorが評価
この程度のタスクにといったら怒られるけど、プロンプト作成に7Bはちょっと重いよねnomadoor.icon
実装
https://github.com/leeooo001/comfyui-Hunyuan-PromptEnhancerleeooo001/comfyui-Hunyuan-PromptEnhancer
関連?
Hard Prompts Made Easy