ChatEval - evergreens

ChatEval

https://scrapbox.io/files/65ae01a8f71c54002402f469.png

複数のエージェントを自律的に議論させ評価を行うマルチエージェントフレームワーク

Debater Agents同士のグループディスカッションにより、人間のアノテーターに近い評価が可能になった

評価プロセスにおける多様な役割を持つアノテーターの必要性を実証した