HHH訓練
HHH訓練(Helpful, Honest, and Harmless訓練)の略
AIモデルがユーザーに対して
有益
正直
無害
な応答を提供するように訓練する
クラウドワーカーがAIとの対話を通じて有益性や無害性を評価し、その結果を基にモデルを改良する。
この方法により、AIはユーザーの期待に沿った応答を提供し、偏りや有害な出力を最小限に抑えることができる。
https://ar5iv.org/abs/2204.05862