生成時使用禁止姓
ChatGPTなどのLLM、生成AIで適当に人名を作成させると、非常に安易に、日本人に多い苗字を使ってきて、キャラクター同士がすぐ親戚みたいになったりする。 微妙にいらいらするので、一覧を持っておく方がいいかもしれない。と思って用意した。やってほしくないことは、先にこちらから言っておかないといけない。
禁止レベル1 佐藤 鈴木
禁止レベル2 田中 伊藤 吉田 中村 山田 加藤 後藤 小川
禁止レベル3 高橋 山本 小林 吉田 佐々木 山口 松本 井上 木村 森 林 池田 橋本 中島 山下
禁止レベル4 渡辺 前田 藤田 岡田 近藤 村上 藤井 斉藤 遠藤
禁止レベル5 長谷川 石井 坂本 青木 三浦 藤原 福田 西村 太田 原田 中野 松田 岡本 中川 田村
基本的に、日本人に多い名字ランキング、という形で持ってこようと思ったけど、自分で創作していたときの経験というか実感として、それ通りにはならないということも分かっていたので、多少順位を入れ替えている。
1位2位はさすがに別格なんだけど、それ以降になると、渡辺、佐々木、長谷川、といった姓はそこまでしょっちゅう出会っている印象がない。また、社長の名前や政治家や芸能人の名前としてイメージが付いてしまってあまり積極的には使いたくない姓もある。
長谷川や佐々木と近藤・岡田なんかを比べると、「〇田」や「〇藤」の他の姓の印象が多重に重なって、実際に出会っている以上に、近藤・岡田はよくある名前に感じてしまう部分があると思う。
他にも、中や村や山や原なんかも、そうなると出会っている可能性は高い。
で、ここにさらに、これはどれだけの人がそう感じるかわからないけど、
ほどほどに画数が多くて、全体に四角くまとまっている漢字(“岡” とか “福” とか)
二文字目(というか最後の文字か?)に濁音の印象が強く残る響きの苗字(それこそ、一部の「〇田」や「〇藤」)
なんかは、さらに多く出会ってきたかのように感じてしまう印象がある。(山本や小林は、たぶんこの辺の感覚のせいで、若干圧迫感が緩和されている)
この辺は不思議だな。
受け取り手によって、かなり感じ方に差が出るかもしれない。
……で、これはさらにあと30位とかやって、上位80とか100の補正レーティングを作れるし作ってもいいんだけど、実用性がたぶん下がる。
生成AIで使うなら、プロンプトの文字数をそれだけ圧迫してしまうし、自分が実用で考えるなら、むしろ「その辺によくありそうな、空気のような姓」を探したくなると思うので、禁止するより、むしろ上手に使う(その中から選ぶ)ことを考えるんじゃないかという気がするからだ。
とりあえず、レベル1〜レベル3は禁止、4-5は頻度制限(一度使ったらそれはしばらく使わない)の指示で、生成させた8人は以下の姓だった。
石田、野村、宮崎、小倉、北川、森下、井口、岡本
それぞれ、下記ランキングで見ると、
59,97,66, 224 ,215,258, 347, 47.
頻度制限群からの使用は1つのみか。別に使うのは使ってもいいって言ってるのに。
99位 市川 100位 菊地、が出始まるあたりが一つの使いやすさのラインかな。服部が 124位、星野・浅野が146位147位。望月で162位、広瀬で174位。片岡、牧野、佐久間で、それぞれ207, 219, 235で、探して選ぶなら、これくらいのエリアに潜りたいかもしれない。