Evals
OpenAIのmodelを評価するためのframework
OpenAI製
github
試した例
https://zenn.dev/laiso/articles/25eb7ea24f29e9
https://zenn.dev/laiso/articles/0c01417c1142b2