ASL
https://scrapbox.io/files/65f8ed0052602100242cc964.png
AI Safety Levels (AI安全性レベル)の略。
Anthropicが、高性能化するAIシステムの開発に伴うリスクを管理するために作成した。
ASLレベルが高くなるにつれて、より厳格な安全性の実証を求めるというもの。
ASL-1
2018年のLLMやチェスのみをプレイするAIシステムなど、意味のある壊滅的リスクがないシステムを指す。
ASL-2
バイオ兵器の製造方法を指示する能力など、危険な能力の初期段階を示すシステムを指すが、検索エンジンができないような情報を提供していないため、情報の信頼性が不十分であったり、まだ有用ではない。現在のLLM(クロードを含む)はASL-2に該当すると思われる。
ASL-3
非AIのベースライン(検索エンジンや教科書など)と比較して、壊滅的な悪用のリスクが大幅に高まるシステム、または低レベルの自律的な能力を示すシステムを指す。
ASL-4以上(ASL-5以上)
現在のシステムからはあまりにも遠く離れているため、まだ定義されていないが、壊滅的な悪用の可能性と自律性において質的なエスカレーションを伴う可能性がある。