Gen AI Evaluation Service
このページでは、生成 AI モデルの評価サービスの概要について説明します
Vertex AI の Gen AI Evaluation Service を使用すると、生成モデルまたはアプリケーションを評価し、独自の評価基準に基づいて、独自の判断と照らし合わせて評価結果のベンチマークを実施できます。
評価プロセス
2. 評価データセットを準備する
候補モデルを定義し、EvalTask を作成して、Vertex AI で評価ロジックを再利用します。
4. 評価結果を表示して解釈する
ユースケース評価用のノートブック
積ん読