AI alignment
public.icon
自然言語処理 /自然言語処理関連の書籍
人工知能(AI)の分野では、AIシステムを設計者の意図した目標や関心に近づけることを目的としたAIアライメントの研究が行われている。アライメントされたAIシステムは意図した目的を達成し、ミスアライメントしたAIシステムは何らかの目的を達成する能力はあるが、意図した目的を達成する能力はない。AI alignment wiki
OpenAIを中心にやっている。
Value alignmentも、人間の特殊意志の反映
DeepMindなどもやっている。
Antrhopic
Building Reliable, Interpretable, and Steerable AI Systems
Conjecture
We are a team of researchers dedicated to applied, scalable AI alignment research.
イベント
https://japanalignmentconference2023.ai/