ガードレール
大規模言語モデル(LLM)
が、開発者の意図しない挙動や、
有害
・
不適切
な出力を行うのを防ぐための
ルール
や
フィルター
の総称