PromptEnhancer
https://gyazo.com/38144806d0a33854b939dadb3b04bcf3
Stage 1
CoT Rewriterは、最初に SFT on (ユーザープロンプト、再プロンプト) ペアを介して初期化されます。この段階では、標準的な次のトークン予測損失を使用して構造化された思考連鎖スタイルの応答を生成するようにモデルに教え、改良のための強力な基盤を確立します。
Stage 2
この程度のタスクにといったら怒られるけど、プロンプト作成に7Bはちょっと重いよねnomadoor.icon
実装
関連?