生成時使用禁止姓

ChatGPTなどのLLM、生成AIで適当に人名を作成させると、非常に安易に、日本人に多い苗字を使ってきて、キャラクター同士がすぐ親戚みたいになったりする。

微妙にいらいらするので、一覧を持っておく方がいいかもしれない。と思って用意した。やってほしくないことは、先にこちらから言っておかないといけない。

禁止レベル1 佐藤鈴木

禁止レベル2 田中伊藤吉田中村山田加藤後藤小川

禁止レベル3 高橋山本小林吉田佐々木山口松本井上木村森林池田橋本中島山下

禁止レベル4 渡辺前田藤田岡田近藤村上藤井斉藤遠藤

禁止レベル5 長谷川石井坂本青木三浦藤原福田西村太田原田中野松田岡本中川田村

基本的に、日本人に多い名字ランキング、という形で持ってこようと思ったけど、自分で創作していたときの経験というか実感として、それ通りにはならないということも分かっていたので、多少順位を入れ替えている。

1位2位はさすがに別格なんだけど、それ以降になると、渡辺、佐々木、長谷川、といった姓はそこまでしょっちゅう出会っている印象がない。また、社長の名前や政治家や芸能人の名前としてイメージが付いてしまってあまり積極的には使いたくない姓もある。

長谷川や佐々木と近藤・岡田なんかを比べると、「〇田」や「〇藤」の他の姓の印象が多重に重なって、実際に出会っている以上に、近藤・岡田はよくある名前に感じてしまう部分があると思う。

他にも、中や村や山や原なんかも、そうなると出会っている可能性は高い。

で、ここにさらに、これはどれだけの人がそう感じるかわからないけど、

ほどほどに画数が多くて、全体に四角くまとまっている漢字（“岡” とか “福” とか）

二文字目（というか最後の文字か？）に濁音の印象が強く残る響きの苗字（それこそ、一部の「〇田」や「〇藤」）

なんかは、さらに多く出会ってきたかのように感じてしまう印象がある。（山本や小林は、たぶんこの辺の感覚のせいで、若干圧迫感が緩和されている）

この辺は不思議だな。

受け取り手によって、かなり感じ方に差が出るかもしれない。

……で、これはさらにあと30位とかやって、上位80とか100の補正レーティングを作れるし作ってもいいんだけど、実用性がたぶん下がる。

生成AIで使うなら、プロンプトの文字数をそれだけ圧迫してしまうし、自分が実用で考えるなら、むしろ「その辺によくありそうな、空気のような姓」を探したくなると思うので、禁止するより、むしろ上手に使う（その中から選ぶ）ことを考えるんじゃないかという気がするからだ。

とりあえず、レベル1〜レベル3は禁止、4-5は頻度制限（一度使ったらそれはしばらく使わない）の指示で、生成させた8人は以下の姓だった。

石田、野村、宮崎、小倉、北川、森下、井口、岡本

それぞれ、下記ランキングで見ると、

59,97,66, 224 ,215,258, 347, 47.

頻度制限群からの使用は1つのみか。別に使うのは使ってもいいって言ってるのに。

99位市川 100位菊地、が出始まるあたりが一つの使いやすさのラインかな。服部が 124位、星野・浅野が146位147位。望月で162位、広瀬で174位。片岡、牧野、佐久間で、それぞれ207, 219, 235で、探して選ぶなら、これくらいのエリアに潜りたいかもしれない。