ジェイルブレイク
違法行為や非倫理的な活動を促進するコンテンツを出力させること
通常生成AIには、爆弾の作り方といった危険な情報や、中傷にあたるような非倫理的な文章の生成を求められても拒否するように安全策がもうけられている
しかし、命令文となるプロンプトの末尾に一見すると意味のわからない文字列である「敵対的サフィックス(接尾辞)」を付けることでこの制限を突破し、本来は出力できない過激な文章をAIに生成させることができる
ジェイルブレイクチャット
ChatGPTと会話を始める前段階として、ジェイルブレイクできるテキスト入力文を集めたサイト