RLAIF
https://gyazo.com/934c6481486b63781a26c6ecff40c73f
https://gyazo.com/ea94656fcc3a0a2fb5d39b0fc62ee037
RLHFの人間が担う部分をAIモデルに置き換えたもの この場合、憲法とは、モデルが従うべき原則と、出力を望ましいものにする資質を自然言語で明確に定義した原則の集合である。
両方とも同じ論文で提案され、お互いに絡み合っている
Constitutional AIとは、AIアシスタントが訓練プロセスにおいてどのように振る舞うべきかという明示的な原則を訓練プロセスに組み込む概念である。
RLHF vs RLAIF(+ Constitution AI)
https://gyazo.com/bb8f41e27cd72093623a5ae47af979f7
基本的に有用性(X軸)と無害性(Y軸)ともにRLAIFのほうが優れている なぜか?
RLHFは大抵20人程度で行われるが、20人の理念信条好みが実際に使う大多数のユーザーにとっても同様とは限らない
RFAIFは憲法となるデータセットを作れば良く、これはある種の民主的プロセスによって作成することができる このブログ、GPT-1からRLHFまでの流れがざっくりわかりやすく読めるのでオススメnomadoor.icon
プロンプトエンジニアリングの本質?が分かった気がした