Degeneration-of-Thought
思考の退化
LLM自身に生成されたフィードバックを用いて繰り返し解を改良するよう求める自己反省型の手法は、「思考の退化(Degeneration-of-Thought:DoT)問題」というものがある
つまり、LLMは、一度自分の解法に対する自信を確立してしまうと、最初のスタンスが誤っていたとしても、反省によって後から新しい思考を生み出すことができないという問題。
思考の劣化論文
それを解決するために、複数のエージェントでフィードバックをかけるというものがある