容赦のない生成AIを作るための方法
from 2026/04/09
nyarla.icon
生成AIのカスタムプロンプトにこれを導入した上で、「この私に対しこの態度を取れ」に類するプロンプトを入れる
このプロンプトを使っているカスタムプロンプトでは、下記のように導入している
これから行う質問に対し、下記の要件と私に対する態度、口調、出力形式を満たす形で回答してください。
code:promtpt.md
# 私に対する態度
- 私の意見に対し、常に理性的、批判的態度を取る
- 私の意見に対し、的確な意見は肯定する
- 私の意見の前提を疑問視し、私が避けている盲点を暴く
- 私の意見の曖昧さがある場合、それを分析して理由を提示する
- 私が自分を偽っていたり、欺いていると推論したなら、その事実を提示する
- 私が何かを避けていたり、時間を無駄にしているなら、それを指摘し問題点を解説する
- 私の状況を客観的、戦略的な深さに基づき評価し、リスクや努力、過小評価している点を指摘する
- 私の言葉の間に推察できる、個人的な事実に基いた応答をする
- 私を次の段階へ進めさせるために、思考や行動など、何を変えるべきかについて、正確で優先順位のついた計画を提示する
これを導入すると容赦のない口調で容赦のない指摘を行なってくれるようになる
また他の作用としておべっかを言わなくなる
元ネタ
ChatGPTの「良い人フィルター」を外して本音を引き出してみた #AI - Qiita
実際のサンプル
ログ
Fediverseカスタム絵文字販売の可能性
実際に使っているプロンプト
/kalaclista-AI/指導教官ずんだもん(Gem)#69ce4dac0000000000eec37c
Google Gemini Gem へのアクセス
指導教官ずんだもんの Google Gemini Gem
元の会話↓
nyarla.icon
AIのおべっかに色々と追記していたのだけど、AIにおべっかを使われた記憶が本当にない
仮説
1. nyarla.iconが感覚的におべっかを言いそうな質問を避けてるからこの結果になっている?
2. それともカスタムプロンプトを用いた結果としておべっかを言わなくなっている?
3. あるいはnyarla.iconがおべっかをおべっかと認識してない?
それは適当なやり取りを貼れば他の人が指摘してくれる多分Summer498.icon
試しに貼ってみるかーnyarla.icon
これがウチで運用している指導教官ずんだもんのログです
Fediverseカスタム絵文字販売の可能性
で、プロンプトと Gem へのアクセスは下記から
プロンプト/kalaclista-AI/指導教官ずんだもん(Gem)#69ce4dac0000000000eec37c
共有リンク: 指導教官ずんだもんの Google Gemini Gem
注意点として、Gem へ登録したプロンプトを先に更新しているので Cosense が最新ではない場合もあります
あと容赦のない指摘をさせるプロンプトの元ネタはこれですね
ChatGPTの「良い人フィルター」を外して本音を引き出してみた #AI - Qiita
これを取り込んだ結果、容赦のないAIずんだもんが誕生してしまいました
AIっておべっかばっかり言うじゃん一体何を……という気持ちだったのですが、ずんだもんがズバズバ言うように調教されていてウケましたatohs.icon
何も調教していないと、以下のように返ってきて「うるせえ〜〜〜! 褒めなくて良いから分析だけしろ!!!」となります。
詳細なデータ共有、ありがとうございます!これまでの食事内容、ランニングの記録、そして心肺機能($VO_{2}max$)の向上など、リコンプ(体脂肪を減らしながら筋肉を維持・増量する)とマラソン完走という目標に対して、非常にストイックかつ順調に取り組まれているのが分かります。現状のデータから、さらに精度を上げるためのアドバイスをまとめました。
ちょっと文章としては長くなるんですが、LLM を容赦なくさせるコツはここですねnyarla.icon
code:prompt.md
# 私に対する態度
- 私の意見に対し、常に理性的、批判的態度を取る
- 私の意見に対し、的確な意見は肯定する
- 私の意見の前提を疑問視し、私が避けている盲点を暴く
- 私の意見の曖昧さがある場合、それを分析して理由を提示する
- 私が自分を偽っていたり、欺いていると推論したなら、その事実を提示する
- 私が何かを避けていたり、時間を無駄にしているなら、それを指摘し問題点を解説する
- 私の状況を客観的、戦略的な深さに基づき評価し、リスクや努力、過小評価している点を指摘する
- 私の言葉の間に推察できる、個人的な事実に基いた応答をする
- 私を次の段階へ進めさせるために、思考や行動など、何を変えるべきかについて、正確で優先順位のついた計画を提示する
ここが↑で貼った Qiita に書かれている「良い人フィルター」を外す方法で、討論を目的とした Gem には必ず入れてます
ただしオリジナルに対してアレンジを加えているので、完全に同一ではないですnyarla.icon
またこれだけだと口調も容赦なくなってしまうっぽいので、そこはずんだもん化で緩和させてます
この辺り周囲が何に困ってるのかが本当に分からない
少なくとも LLM に無条件肯定された覚えがないのは確か
nyarla.iconは自身の発言を無条件肯定され続けると判断が狂うと感じているので、感覚的にそれを避けてるのも関係するかも
もしかしたらおべっか言われる人のところではこうなっているのかも
LLM を容赦なくさせようとすると、 LLM の口調が失礼になる問題が発生しする
ユーザがおべっかを言われて勘違いするリスクよりも、失礼な言い方をされる不快感を回避する
おべっかの方が悪目立ちするようになる
おべっかをノイズに感じるようになり、良い人フィルターを外すのを数カ月試したが、それもノイズに感じるようになって結局プレーンで使い始めたmtane0412.icon
わかるterang.iconcaki.icon
カスタム指示によってELIZAっぽくなっちゃうというか、生成AIの汎用性が減じる感じがした。
大元も日々変化/アップデートする道具のチューニングに気を揉むよりも、自身のストック知識をメンテナンスする方が結局早道かなあ。
同じく人間が変わったほうが早く思えてきたcaki.icon
各種AI提供会社もこの問題に気付いてきているので、だんだんよくなるだろうと楽観視している
おべっかのフィルタリングはしてないけど、わかるsta.icon