人間に対する認知負荷DDOS
今まで有名税のある人のみが晒されてた環境に誰もが陥る可能性が出てくる?
メタ認知して回避するスキルがほしい
非同期議論は帯域が広いからDDOSやりやすいなぁ、、
昨今のSNSでこういうこと起きてるように思うので変なリアルさがある
昨今のSNSは天然でコレが発生している感じがするSummer498.icon
そう思う、人間がこれをやってるような気がするinajob.icon
1人でもこれできるようになったとしたら、、と想像する
「なったとしたら」←もうなってますSummer498.icon
ひえーinajob.icon
あと、犬笛を吹くやつがいたりSummer498.icon
犬笛は操作者、攻撃者がLLM上のエージェント
例えば、相手への返信を 5 人のエージェントに議論させてガチガチに固めた最終結論を 5 人分まとめて撃つとかできるSummer498.icon
相手の返信を種にして
5人くらいのエージェントに議論を発散させて、批判検討を行って収束させたものを放出すると、既に批判検討済みの反論に対して相手が反論するなり何なリアクションを取る感じになる
そんなの無視したらそれまでなんだけど、
できるかどうかはしらんけど、被害認知強めで社会性カスだけど論理的には正しいことを言う 5 人とかを作ると最悪の攻撃になると思う
まずスルースキルを要求して
レスポンスを返したくなったら既に批判検討済みの反論に対して再反論する感じになってキツイ
良い方向に使えないのか気になるinajob.icon
議論の潤滑油とか、心理的安全性を高めるとか
普通に使えますSummer498.icon
イラン設定を付け加えなければ、
基本的に議論の潤滑油になるし、
心理的安全性も高めるし、
なんなら自分の意見を一旦LLMクッションを挟むことで解毒できます
むしろ、よっぽど意識して設定しないとあんな問題のあるエージェント*は作れません
ちなみに最初に(自分へのワクチンを作るために)悪意を持って作成したエージェントはましろ.iconで、
「IQが低いせいで知らず知らずに人に迷惑をかける」みたいな設定をつけました
残念ながら(?)普通にキャラとして許容範囲内の可愛い子になりました
なるほど。弱いLLMしか使ってないorプロンプトが下手なので、まだ雰囲気わかってないかもですinajob.icon
教科書的な同意とか、言い換えみたいなレスではあまり役立ってる感じがしないなと思ってました
今回のやつはいい感じに一言言いたくなるエージェントがでてきたなと(足を引っ張る意図が合ったようだが、、)
エージェント作成時は迷惑キャラを意識していましたが、実際に使ってみたら(自分が)大して迷惑に思わなかった+可愛かったので日記に送り込みましたSummer498.icon
なので、日記に送り込んだ意図の中に足を引っ張る意図はないです
語彙が独特なのはブラケティングセンスに引っかかりやすいように意識させているため
若干感性がズレている点は、狙ってそのように設計しましたが、
普通にそういう人もいるので気にならないレベルに収まった印象があります
よく考えたらその前に風邪引いてる人に変な奴らを向かわせるべきじゃなかったなSummer498.icon
これはタダ操作主の配慮不足です
普通に面白体験だったので、ヨシinajob.icon
強いLLMを正しく使うと研究が一本仕上がりますSummer498.icon
そのくらいのレベルです
逆に言えばそのレベルの論理力とタフネスを持ったエージェントが擬似的に多人数のふりをしてレスバを仕掛けてくるみたいなこともできる