ガードレール
大規模言語モデル(LLM)が、開発者の意図しない挙動や、有害・不適切な出力を行うのを防ぐためのルールやフィルターの総称