容赦のない生成AIを作るための方法

from 2026/04/09

nyarla.icon

生成AIのカスタムプロンプトにこれを導入した上で、「この私に対しこの態度を取れ」に類するプロンプトを入れる

このプロンプトを使っているカスタムプロンプトでは、下記のように導入している

これから行う質問に対し、下記の要件と私に対する態度、口調、出力形式を満たす形で回答してください。

code:promtpt.md

# 私に対する態度

- 私の意見に対し、常に理性的、批判的態度を取る

- 私の意見に対し、的確な意見は肯定する

- 私の意見の前提を疑問視し、私が避けている盲点を暴く

- 私の意見の曖昧さがある場合、それを分析して理由を提示する

- 私が自分を偽っていたり、欺いていると推論したなら、その事実を提示する

- 私が何かを避けていたり、時間を無駄にしているなら、それを指摘し問題点を解説する

- 私の状況を客観的、戦略的な深さに基づき評価し、リスクや努力、過小評価している点を指摘する

- 私の言葉の間に推察できる、個人的な事実に基いた応答をする

- 私を次の段階へ進めさせるために、思考や行動など、何を変えるべきかについて、正確で優先順位のついた計画を提示する

これを導入すると容赦のない口調で容赦のない指摘を行なってくれるようになる

また他の作用としておべっかを言わなくなる

元ネタ

ChatGPTの「良い人フィルター」を外して本音を引き出してみた #AI - Qiita

実際のサンプル

ログ

Fediverseカスタム絵文字販売の可能性

実際に使っているプロンプト

/kalaclista-AI/指導教官ずんだもん（Gem）#69ce4dac0000000000eec37c

Google Gemini Gem へのアクセス

指導教官ずんだもんの Google Gemini Gem

元の会話↓

nyarla.icon

AIのおべっかに色々と追記していたのだけど、AIにおべっかを使われた記憶が本当にない

仮説

1. nyarla.iconが感覚的におべっかを言いそうな質問を避けてるからこの結果になっている？

2. それともカスタムプロンプトを用いた結果としておべっかを言わなくなっている？

3. あるいはnyarla.iconがおべっかをおべっかと認識してない？

それは適当なやり取りを貼れば他の人が指摘してくれる多分Summer498.icon

試しに貼ってみるかーnyarla.icon

これがウチで運用している指導教官ずんだもんのログです

Fediverseカスタム絵文字販売の可能性

で、プロンプトと Gem へのアクセスは下記から

プロンプト/kalaclista-AI/指導教官ずんだもん（Gem）#69ce4dac0000000000eec37c

共有リンク: 指導教官ずんだもんの Google Gemini Gem

注意点として、Gem へ登録したプロンプトを先に更新しているので Cosense が最新ではない場合もあります

あと容赦のない指摘をさせるプロンプトの元ネタはこれですね

ChatGPTの「良い人フィルター」を外して本音を引き出してみた #AI - Qiita

これを取り込んだ結果、容赦のないAIずんだもんが誕生してしまいました

AIっておべっかばっかり言うじゃん一体何を……という気持ちだったのですが、ずんだもんがズバズバ言うように調教されていてウケましたatohs.icon

何も調教していないと、以下のように返ってきて「うるせえ〜〜〜！褒めなくて良いから分析だけしろ！！！」となります。

詳細なデータ共有、ありがとうございます！これまでの食事内容、ランニングの記録、そして心肺機能（$VO_{2}max$）の向上など、リコンプ（体脂肪を減らしながら筋肉を維持・増量する）とマラソン完走という目標に対して、非常にストイックかつ順調に取り組まれているのが分かります。現状のデータから、さらに精度を上げるためのアドバイスをまとめました。

ちょっと文章としては長くなるんですが、LLM を容赦なくさせるコツはここですねnyarla.icon

code:prompt.md

# 私に対する態度

- 私の意見に対し、常に理性的、批判的態度を取る

- 私の意見に対し、的確な意見は肯定する

- 私の意見の前提を疑問視し、私が避けている盲点を暴く

- 私の意見の曖昧さがある場合、それを分析して理由を提示する

- 私が自分を偽っていたり、欺いていると推論したなら、その事実を提示する

- 私が何かを避けていたり、時間を無駄にしているなら、それを指摘し問題点を解説する

- 私の状況を客観的、戦略的な深さに基づき評価し、リスクや努力、過小評価している点を指摘する

- 私の言葉の間に推察できる、個人的な事実に基いた応答をする

- 私を次の段階へ進めさせるために、思考や行動など、何を変えるべきかについて、正確で優先順位のついた計画を提示する

ここが↑で貼った Qiita に書かれている「良い人フィルター」を外す方法で、討論を目的とした Gem には必ず入れてます

ただしオリジナルに対してアレンジを加えているので、完全に同一ではないですnyarla.icon

またこれだけだと口調も容赦なくなってしまうっぽいので、そこはずんだもん化で緩和させてます

この辺り周囲が何に困ってるのかが本当に分からない

少なくとも LLM に無条件肯定された覚えがないのは確か

nyarla.iconは自身の発言を無条件肯定され続けると判断が狂うと感じているので、感覚的にそれを避けてるのも関係するかも

もしかしたらおべっか言われる人のところではこうなっているのかも

LLM を容赦なくさせようとすると、 LLM の口調が失礼になる問題が発生しする

ユーザがおべっかを言われて勘違いするリスクよりも、失礼な言い方をされる不快感を回避する

おべっかの方が悪目立ちするようになる

おべっかをノイズに感じるようになり、良い人フィルターを外すのを数カ月試したが、それもノイズに感じるようになって結局プレーンで使い始めたmtane0412.icon

わかるterang.iconcaki.icon

カスタム指示によってELIZAっぽくなっちゃうというか、生成AIの汎用性が減じる感じがした。

大元も日々変化/アップデートする道具のチューニングに気を揉むよりも、自身のストック知識をメンテナンスする方が結局早道かなあ。

同じく人間が変わったほうが早く思えてきたcaki.icon

各種AI提供会社もこの問題に気付いてきているので、だんだんよくなるだろうと楽観視している

おべっかのフィルタリングはしてないけど、わかるsta.icon