ChatEval
https://scrapbox.io/files/65ae01a8f71c54002402f469.png
ChatEval論文
複数のエージェントを自律的に議論させ評価を行うマルチエージェントフレームワーク
Debater Agents同士のグループディスカッションにより、人間のアノテーターに近い評価が可能になった
評価プロセスにおける多様な役割を持つアノテーターの必要性を実証した