HaluEval
HaluEval: ハルシネーションを認識できるかを評価するベンチマーク
ChatGPTが幻覚を起こしやすいデータで構成
Yes or Noを判定する
GitHub:
https://github.com/RUCAIBox/HaluEval