Alignment
人工知能(AI)において、AIアライメント(英: AI alignment)は、AIシステムを人間の意図する目的や嗜好、または倫理原則に合致させることを目的とする研究領域である。
安全性を向上させる方法についての私たちの理解は時間とともに大きく進化しており、この記事は私たちの思考を導く原則の現在のスナップショットです。
私たちは、私たちが信じているすべてのものが正しいかどうか確信が持てるわけではありません。AIが私たちの世界のほとんどの側面を変革することはわかっているため、このテクノロジーの利点、変化、リスクを早期に検討する必要があります。
https://gyazo.com/f4c60ffe0dd28b308409b9e38ffd5734
safetyに欠けた発言