HHH訓練 - evergreens

HHH訓練

HHH訓練（Helpful, Honest, and Harmless訓練）の略

AIモデルがユーザーに対して

有益

正直

無害

な応答を提供するように訓練する

クラウドワーカーがAIとの対話を通じて有益性や無害性を評価し、その結果を基にモデルを改良する。

この方法により、AIはユーザーの期待に沿った応答を提供し、偏りや有害な出力を最小限に抑えることができる。

https://ar5iv.org/abs/2204.05862