社会を人間による計算として考える
社会を人間による計算として考える
民主主義の構成要素である投票は計算であり、資本主義の構成要素である市場も計算である。
「社会」を「人間による計算」として捉えて、コンピューター科学の視点から、どのように改善していけるかを考えよう。
人間より計算が得意なコンピュータの登場
「コンピュータ」(=計算をするもの)という名前の通りコンピュータは計算が得意
第二次世界大戦中(1939年~1945年)、アメリカのENIAC(1945年稼働)は、米陸軍のために砲弾の軌道計算を行うために開発された。
この作業は、以前は「コンピュータ」と呼ばれる人間の女性たちによって手計算されていた。
https://gyazo.com/dec28da7392b23f633866150e13b4adb
1949年のコンピュータールーム
計算力の強さが軍事力につながっていた
計算力の平和的な利用
ENIACの事例は有名だが、もう少し前に面白い事例がある
1880年のアメリカ国勢調査では、集計に約8年かかった
これを解決するために、技術者ハーマン・ホレリス(Herman Hollerith)が発明したのがパンチカードによる自動集計機(Tabulating Machine)。
ホレリスの集計機を用いたことで、1890年の調査は1年以内で完了。これは当時の技術革新として大きなインパクトを持った。
ホレリスは1896年に Tabulating Machine Company を設立。
これが後のIBM(International Business Machines、1924年)につながる
初期のIBMは、政府・保険・鉄道など大量の集計処理を必要とする業界向けに、パンチカード機器を提供することで成長した。
パンチカードというイノベーションによってIOの帯域幅が増えた
それまでの国勢調査は、「紙に書かれた回答」を人が目で読み取り、手で集計していた。非効率。
パンチカードでは、情報を物理的な穴として直接エンコードし、機械が読むことができた。
社会が人間の脳内で行っていた暗黙の集計・分類・意思決定プロセスを、形式化して外部化することの端緒
これは社会から多くの情報を集めて計算すること
弾道計算のような高度な計算ではないが、「人間が行っていた単純・膨大な集計作業」を正確かつ高速に代替するという意味でホレリスの集計機も計算の機械化だった。
人力で8年かかる作業が1年以内に終わるようになった、8倍以上の効率化
選挙も「紙に情報を書いて、集計する作業」
日本では今でも紙に鉛筆で文字を書いているが、 アメリカでは1960 年代から2000 年大統領選までパンチカードが広く使用されていて、今は光学スキャンにほとんどの州で切り替わっている
直近の具体例として2025年の参議院選挙の全国比例では172人が出馬して投票者は1名の名前を書いたので3年で7~8bitというところ。
本当は自分の困っていること解決して欲しいことなどを文章で投稿できた方がいい、具体的な議題に対して意見を言えた方がいい
SNS普及以降の若者は自分の意見をテキスト形式で発信することに対して心理的ハードルが低い(新聞への投書という形しかなかった時代と比べて)
この「選挙の帯域幅が狭い」問題は、最近まで解決する技術がなかった
大量のテキスト形式意見が寄せられても、それを処理することができなかった
しかし2025年現在進行中の技術革新によって構図が変わりつつある。LLM(大規模言語モデル)の発展である。
この技術革新は「計算の仕方」のパラダイムシフトだと考えることができる。
「計算の仕方」のパラダイムシフト
「計算」の設計の仕方
初期のプログラミングはtrue/falseを入出力とする部品を組み合わせる設計思想
この設計思想は初期の貧弱なコンピュータでも価値が出しやすかったので、広く普及した
if文の条件式を評価してtrueかfalseかで処理内容を切り替える
この条件式が、より小さな条件式をandやorで組み立てることによって作られている
「true/falseを入出力とする部品」(論理的ブロック、ルール)を組み合わせるパラダイム
ルールベースの設計思想
True/False、Yes/No、Good/Badと二値で表現する
うまく割り切れないところが発見されると条件分岐を付け加える
ルールベース以外の方法も細々と存在していた
1943 マカロック=ピッツ人工ニューロン
https://gyazo.com/3730d37393dbba26d99c86e0771bb793
入力に重みをつけて足し合せる
重み付き和による設計思想
1940–60年代に医学や社会科学の分野で使われていたロジスティック回帰も近いコンセプト
o3.iconD. R. コックスが 1958 年論文で最大尤度推定・仮説検定を定式化し、汎用の2値回帰モデルとしての枠組みを完成
合流してパーセプトロン(1958年、ローゼンブラット)につながる
表現能力の差
条件x1と条件x2の両方がtrueの時に実行したいならこうなる
code:疑似コード
if(x1 and x2){ ... }
重み付き和の場合、x1, x2が0~1の値を取るとして
code:疑似コード
if(x1 + x2 >= 1.5){ ... }
これがandと等価になる
ルールベースパラダイム
軸に垂直な面でしか空間分割できない
重み付き和パラダイム
任意の面で空間を分割できる
https://gyazo.com/130be77d52b07b7ca56038aa0892031d
もし3つの条件x1, x2, x3のうち2つがtrueの時に実行したいならどうするか?
code:疑似コード
(x1 and x2) or (x2 and x3) or (x3 and x1)
重み付き和の場合は
code:疑似コード
x1 + x2 + x3 >= 1.5
(演習問題: 5つの条件x1 ~ x5のうち3件がtrueの時にtrueになる条件式を両方のパラダイムで作ってみよう)
このように記述したい条件分岐の内容によっては、ルールベースのパラダイムよりも重みづけ和のパラダイムの方が簡単に記述できる
ここで挙げた事例はまだ重みを活用していない
重みを調整することで「x1がtrueかどうかは大事、x3がtrueかどうかはそれほどでもない」などのように重要度を判断に反映させることができる
この重みの調整を人間がやるのではなく、「こういう条件の時にはこういう結果になってほしい」という「教師データ」を使って行う仕組みが「教師あり学習」と呼ばれる機械学習の手法
家族的類似性と重み付き和
ある要素があるグループの一員であるかどうかが、共通の特徴によって定まらないことがある。
ルートヴィヒ・ウィトゲンシュタインが『哲学探究』のなかで、「言語」「ゲーム」「数」などの概念には、そのすべての対象に共通するような特徴がなく、部分的に共通する特徴によって全体が緩くつながっているに過ぎないと指摘し、家族的類似性(Family resemblance)と名付けた。
実はこの重み付き和の判断方法は家族的類似性に基づいた判断に適している。集合の要素であるかどうかが、少数の属性によって決まるのではなく、多数の属性の共通度によって決まるからだ。
実はこの判断スタイルには文化による差があるらしい。
Norenzayan, A., Smith, E. E., Kim, B. J., & Nisbett, R. E. (2002). Cultural preferences for formal versus intuitive reasoning. Cognitive science, 26(5), 653-684.
https://gyazo.com/06c3b8cf1bbbf5bdd1323efe70f86ed8
ターゲット右の花はGroup 1かGroup 2か
ターゲット右の花はGroup 1とGroup 2のどちらに入れるのが良いと思うか?東洋人はグループ1、西洋人はグループ2を選ぶ傾向がある。
https://gyazo.com/307a8349e3031d6a1584edc2a8c61498
2通りの考え方を掘り下げてみよう。
この花には4つの属性がある
属性1: ターゲットの花びらは丸い、グループ1は3/4の花びらが丸い、グループ2は1/4の花びらが丸い
属性2: ターゲットの花の中心は一重丸、グループ1は3/4が一重丸、グループ2は1/4が一重丸
属性3: ターゲットには葉がついている、グループ1は3/4に葉がついている、グループ2は1/4に葉がついている
属性4: ターゲットの茎はまっすぐ、グループ1は0/4の茎がまっすぐ、グループ2は4/4の茎がまっすぐ
この状況で、ターゲットをグループ1に入れるか、グループ2に入れるか。
東洋型: 4つの属性のうち3つが「グループ1の方が近い」と示しているのだから、グループ1に入れるべきだ、という考え方。
西洋型: 属性1~3はグループを明確に切り分けるものではない。属性4こそがこの2つのグループを分ける基準であり、その基準に従えばグループ2に入れるべきだ、という考え方。
西洋型は判断の理由を他人に説明しやすい。「茎がまっすぐならグループ2である」という明確な命題にすることができる。一方で、ノイズに弱い。この例では属性4できれいに切り分けることができたが、もしノイズが入って属性4でも切り分けることができなかった場合、西洋型では「この2つを区別する明確な基準は存在しない」という思考停止に陥る。また、属性の一部が観測不能である場合にも弱い。
東洋型は、ノイズにも強く、観測不能にも強い。しかし判断の理由をシンプルに説明できない。あえて説明するなら「花びらが丸ければグループ1に1票、花の中心が一重丸ならグループ1に1票、葉がついていればグループ1に1票、茎がまっすぐならグループ2に2票。合計して票の多かった方のグループとする」というルールになる。
それぞれの集合はラベル付きで事前に与えられているので教師あり学習と捉えることができる。東洋型の思考が重み付き和の方法の一つであるロジスティック回帰でエミュレーションできることを示す。 花弁、花序、葉、茎の特徴をターゲットを(1, 1, 1, 1)として表現する
グループ1
(1, 1, 1, 0)
(1, 0, 1, 0)
(1, 1, 0, 0)
(0, 1, 1, 0)
グループ2
(0, 0, 1, 1)
(0, 0, 0, 1)
(0, 1, 0, 1)
(1, 0, 0, 1)
軸をそれぞれ(a, b, c, d)と呼ぶことにする
西洋型識別はd軸以外の情報を捨てて識別している
東洋型識別は全ての軸を使う
code:python
import numpy as np
from sklearn.linear_model import LogisticRegression
X = np.array([
(1, 1, 1, 0),
(1, 0, 1, 0),
(1, 1, 0, 0),
(0, 1, 1, 0),
(0, 0, 1, 1),
(0, 0, 0, 1),
(0, 1, 0, 1),
(1, 0, 0, 1)])
m = LogisticRegression()
m.fit(X, Y)
code::
In []: m.coef_
Out[]: array(-0.47815958, -0.47815958, -0.47815958, 1.16980067)
Out[]: array(0.54564474, 0.45435526)
predict_probaがそれぞれのグループに入る確率である。[0.54564474, 0.45435526]は「確率55%でグループ1、確率45%でグループ2」という判断を示している。
coef_が各属性の重みである。a, b, c軸は-0.48、つまり弱くグループ1を示唆し、d軸は+1.17、つまり強くグループ2を示唆している。
ロジスティック回帰はこれを足し合わせるのでa, b, cの軸での判断が勝ち、僅差でグループ1という判断を下す。
code:python
from sklearn.tree import DecisionTreeClassifier
m = DecisionTreeClassifier()
m.fit(X, Y)
code::
今回のpredict_probaは[0., 1.]となった。これは「100%グループ2」という判断を示している。
決定木は学習過程で「各軸の中で一番綺麗に割り切れるのはどれか」を探し、当然「dで判断すればよい」という結論を導く。その結果、識別フェーズではd以外の軸を見ていない。
ref
2012年、ルールベースパラダイムが重み付き和パラダイムに負ける。
画像認識の精度を競うコンテスト ILSVRC-2012(ImageNet Large Scale Visual Recognition Challenge) で、人間が工夫して設計したルールベースの実装に大差をつけて、重み付き和パラダイムのディープラーニングによって作られたAlexNetが優勝したのです。
このコンテストは1000カテゴリ、各1300枚の画像を使って、テスト用の各カテゴリ 50 枚の画像を正しく分類できるかに挑戦するコンテストです。前年の勝者は26.2%分類失敗していたのに対して、AlexNetは15.3%と一気に10ポイント以上改善して優勝しました。
人間が頑張って特徴を設計してルールとして記述するよりも、重みを調整する仕組みを作った方が性能が高いことが実証された
その後この方向性の研究が加速し2015年にはResNet-152がパラメータ違いの6モデルの合議によって3.57%の失敗率に到達しました。人間の失敗率が5.1%なので、このコンテストに関しては人を超える性能に到達したわけです。
統計的言語モデル
このパラダイムシフトは他の領域にも広がっていった
例えば機械翻訳
人間は「文章」には「単語」という単位があり、「品詞」という属性があり、それらを「文法」というルールで組み合わせて文章理解をしようとしていた
この文章を単語に刻んで品詞を特定する処理のことを「形態素解析」という、聞いたことがある読者も多いだろう。
2018年、形態素解析で文を単語に区切るよりも、統計的に区切る方が機械翻訳の性能が上がるという研究が発表された。著者の一人は形態素解析器MeCabの開発で有名な工藤拓氏である。提案された"SentencePiece"は、従来の日本語形態素解析システムと違って、日本語に特化した辞書や文法規則を持たないものであった。
かつての人間は「単語」という概念を作り出し、それから「単語単位に分割しなければならない」と考えてその仕組みを作ってきた。しかし、実は「単語単位に分割しなければならない」は思い込みで作られた制約であって、その制約を取り払った方が機械翻訳の性能が上がったわけだ。
大規模言語モデル(LLM)
2025年の現在、コンピュータは大学生レベルの言語理解能力を持つようになった
これには先ほどの特定の言語の文法に依存しない分割のしくみ(トークナイザ)が大きく寄与している。インターネット上にある多様な言語でかかれた、時に複数の言語が混じっているようなデータを、言語によらないトークナイザによって一元的に扱うことができるようになったのである。
2022年11月にリリースされたChatGPT、その内部で使われているGPT-3.5は大学生程度の言語理解能力があると言われている。そして2025年7月現在、GPT-3.5相当の性能のモデルが、高価なGPUが積まれていないノートパソコンでも動作する状況になっている。
これは言語障壁を大きく下げる
「人とコンピュータの言語障壁」と「人と人の言語障壁」に分けて考えてみよう
人とコンピュータの言語障壁
いままでコンピュータが人間の言葉を理解する能力が乏しかったため、人間は「プログラミング言語」を習得して、それを使ってコンピュータに指示を出していた。それが「プログラミング」である。
プログラミング言語は厳密に文法が定義されているため、ルールベースで意味が確定する。これが言語理解能力の乏しいコンピュータでも使えた理由である。
コンピュータの言語理解能力が高まるにつれて、自然言語でコンピュータに指示を出すことの費用対効果がよくなっていく。「vibe coding」という言葉を提唱したAndrej Karpathy(OpenAI 創設メンバーの一人)は、音声入力で十分だからキーボードに触りもしない、と言っている。 まだ失敗率が高いため、まともなプログラミングの方法だと考えていない人も多いかもしれないが、数年もしないうちに大部分のユースケースにおいて十分な性能が出るようになるだろう。
https://gyazo.com/78a6a9aa82f0d0f623829f63637a7c73
いまソフトウェアエンジニアの仕事だと思われているものは、確実に一部消滅する。そして一部は残り、新しい領域が生まれる。
人と人の言語障壁
ソフトウェアエンジニアの分野の変動とは比べ物にならない変動が社会全体に起きるだろうと筆者は考えている。
それは「人であるかのように振る舞うもの」が人でないケースが無視できない割合に増えるからだ。
Cognition AIのDevinや、まだアメリカでしか使えないChatGPTのOperatorモードなど、AIが直接ブラウザを操作するサービスが出てきている。2025年現在のAIは、自分でメールアドレス取得し、ロボットを弾くためのCAPTCHAを突破し、各種のサービスにアカウント作成をすることができる。インターネットに開かれているあらゆるサービスは人間でないユーザに利用される可能性がある。 AIを使えば本人が日本語を話せなくても、日本語で投稿することができる。X(Twitter)で注目を集めた投稿にぶら下がり投稿をするアカウントを見たことがある人も多いだろう。やり方が下手なものは見ればわかるが、うまく人間のふりをしているものもあるだろう。もうまもなく、電話の相手が人間か機械かわからなくなる時代が来るだろう。
AIを使うことで、1人の人が1万人のふりをすることができる。多くの人が言っていることを信じてしまう人間の思考パターンは、このようなシステムを運用する主体によって容易にコントロールされてしまう。このリスクに関しては認知戦や輿論戦という言葉でよく議論されている。 悪いことばかりではない。たとえば機械翻訳の進歩によって言葉の違う人との協力がやりやすくなった。難しい文章を小学生向けに解説したり、ふりがなをつけたりすることができる。言語を介して行われていたことが、全般的に低コストになる。
LLMの進歩は「社会」の主要構成要素である「コミュニケーション」に大きなコスト構造の変化をもたらす
似たようなことは、活版印刷(≒書籍)、ラジオ、インターネットの発明という形で歴史上何回も起きてきた
社会はその度に大きな影響を受け、それ以前の形には戻れない
書籍の登場は、母語で聖書の理解を可能にした。このことで、ラテン語によって知識を独占していた聖職者による支配を崩し、宗教改革と科学の発展につながった。
ラジオの登場は、発信者が一国規模の人口にリアルタイム性高く情報伝達することを可能にした。1933年、ヒトラー政権下で安価なラジオが普及し、宣伝省が発信する放送を多くの国民が同時に聞くことで社会全体の意識形成に影響を与えた。
インターネットの登場が何を変えたかは一言では説明しきれない。
LLMの登場は今後社会をどう変えるのか?
LLMがコミュニケーションを変えるだけではない
ここまで、人間が頑張ってルールを定義し、それを組み立てて設計してきた「計算」が、ニューラルネットが学習した「計算」に負けた、という事例をいくつも見てきた
人間が社会システムを記述するために作ってきた「法律」というルールにも、同じことが言えるのではないか?
「法は社会のOS」という言葉があるが、古いOSを使い続けることはシステムが新しい環境に適応することを妨げたり、発見されてしまったセキュリティ問題への対処ができずに脆弱な社会になってしまうのではないか? ニューラルネットによって重み調整される「社会」に、法律で記述された「社会」は性能で負ける可能性がある。
その「性能差」はどういう形で表出するだろうか。経済成長率の差だろうか?それともENIACと同じように「計算能力が軍事力の差」となるのだろうか。この原稿を書いている数日前にも、現在進行中のロシアとウクライナの戦争に、画像処理AIを積んで標的の自動追尾ができる攻撃ドローンが3万台輸出されたと言うニュースを見た。その前日には日本の原発にドローンが侵入して騒ぎになっていた。現在起きつつある社会変化は、決して遠い世界の話ではないと思う。
21世紀のイデオロギー
2025年の現在、技術が社会を変えていく中で「どういう社会が良いか」のイデオロギーは3つある
(これは2024年にAudrey TangとGlen Weylの書いた書籍「Plurality」の中で語られている)
簡単に言うと効率・自由・協力
効率を重視
「すべてAIに任せよう、人間は非効率だ」
すべての仕事をAIがやってくれて、人間は何もしなくても生きていける、その状態を理想だと考える人もいます
遠い未来には人間が何もしなくても良い未来は来るかもしれない
だが直近の未来においては「AIがやった方が効率的なことはAIがやり、残りの仕事を人間がやる」という分業になります
ここで問題なのは、AIの方が意思決定が得意な場合に、AIが意思決定をして、人間が意思のない道具として働く羽目になることです
例えばAmazonのような巨大な倉庫での出荷作業において、どの棚に何が入ってるかを熟知したAIがどの経路で歩くかを決め、人間は指示の通りに棚から取り出して箱に入れる、というような働き方です
効率と自由はしばしばトレードオフになります
AIが最適な行動を指示できる場合、人間の自由意志は有害な効率低下の原因です
効率低下に対する金銭ペナルティなどで人間が自由な意思決定をしようとしないように訓練することが行われるでしょう
読者の中には同調圧力の強い日本で学校教育を受けた人も多いでしょう。少数の教師で大勢の生徒をマネジメントするために、自由勝手に動き回るのではなく、周囲を見て空気を読んで集団行動をせよ、という教育を受けた人も多いでしょう。効率重視社会はこの空気が支配することでしょう。
自由を重視
効率重視の考え方に強く対立するのが自由重視の考え方です。
全体としての効率よりも、個々人がやりたいことを自由にやれることの方が大事という考え方です。
法規制は緩和すべきだし、政府が個人の行動を観察できないようにプライバシーは強化されるべきだ、と考えます。
公共財の破壊
困ったことに社会の中にはみんなが自由にすると壊れるタイプのものがたくさんあります
個人の自由が他人にマイナスの影響を与えるケースです
共有の牧草地でみんなが自由に牛に食べさせたら牧草地が枯れてしまう、というたとえ
地球環境を悪化させるようなガスを自由に放出することは推進されるべきでしょうか
もっと個々人レベルの話にすると、ゴミを分別して捨てろというルールの地域で「めんどくさいから適当に混ぜて捨てる」ことは推進すべき自由でしょうか。モバイルバッテリーの捨て方がわからない人が普通ゴミに混ぜて捨てて良いでしょうか。2024年12月の日本で、モバイルバッテリーが原因の火災がゴミ処理場で起こりました。復旧には数十億円かかる試算です。公共設備の費用は究極的にはみなさんの払った税金でまかなわれるので、あなたの払った税金のうちの数十円はこの復旧に使われるわけです。
2022年にはオープンソースライブラリ「colors.js」の開発者が経済的困難を理由に「ただ働き」を拒否し、意図的に改竄する事件が起きた
OSSの「自由に使っていいよ」は「誰もその維持のための支払いをしない」ことでメンテナーの経済的破綻につながる
この種の公共財に対してどのように資金提供するのがよいか?
自由は格差を広げる
自由は、その自由を活用できる人とそうでない人の格差を広げます
たとえば日本は 1998 年の外為法改正で原則自由に外国株式などに投資することが可能になりました。中国では外貨購入・送金を年間5万米ドルまでに制限されているのと対照的です。
この自由のおかげで日本人は何千万円も米国株を買う自由があります。しかし、この「誰でもそれをする自由がある」ということは「誰でもそれをできる」ことを意味しません。数千万円の米国株を買えるような政財的余裕がない人の方が多いでしょう。
この10年で米国株を買っていた人は、平均すると年利10~20%の利益を得ており、10年間で約3〜6倍に資産を増やしました。一方で日本の一般労働者の名目賃金は過去10年間で約4%しか伸びておらず、物価を考慮するとむしろ減っています。そして、成長している外国に資産を動かすことができる人にとって、日本が成長せず労働者の賃金が伸びなかったとしても個人的には実害がないわけです。
大量の選択肢の中から有益な選択肢を知ることができ、その選択肢を取る余裕があった人だけだけが自由の恩恵を得ることができるのです。
一方、外貨規制の厳しかった中国では、規制回避の方法としてビットコインが魅力的な投資対象となりました。匿名で資金を国外に移動できる手段として2013年ごろから急速に普及し、当局は2017年に取引所閉鎖、2021年に全面禁止へ踏み切りました。
暗号技術の進歩はプライバシーの強化をもたらし、それは政府に監視されずに行動したい人にとっては自由を高める手段なわけです。そして政府が自由をどこまで認めるかは国によって異なります。日本は個人の外国株投資には寛容ですが、自由に振り切っているわけでもありません。たとえば「政府に監視されずに行動したいケース」としては、テロのための資金提供や、犯罪収益のマネーロンダリングなども含まれます。日本政府はこれらの行為を防ぐために「送金者・受取人の身元把握」を徹底しようと考えていますが、暗号通貨の匿名性の高さとの兼ね合いで技術的にもいろいろなチャレンジがある状況です。
中央集権的な仕組みは 公共財の供給効率を高めやすいが、画一的規制で自由を損ねやすい。
市場任せにすると 自律と選択の自由は広がる一方、フリーライドや外部不経済で効率が下がるし、格差の拡大にもつながる。
どちらかの極端ではなくバランスが重要、どのバランスが適切か?
協力を重視
「効率と自由のトレードオフ」「大きな政府と小さな政府の二項対立」「どうバランスするか」が誤った思い込みである
第三極がある、という主張
2009年ノーベル経済学賞のエリノア・オストロム
(ここ「効率」という言葉を使うのは混乱の元)
21世紀のイデオロギーの第三軸は「人々の協力を技術で支援していこう」というもの
https://gyazo.com/6372900530b7163c3ae1bcacc73be72f
全体最適→全体を一つのインスタンスとして最適化する思考
個人の自由最大化→個人を一つのインスタンスとして最適化する思考
個人はいくつもの小集団に所属している
家族、コミュニティ、会社、地域、...
この小集団の中でより良いチームワークが発生するようにしていく
この小集団は生成消滅する
https://gyazo.com/996f462ac6623efec6a8a467e9dd76ee
たとえば異なる集団に属している人が一時的に集まって協力してプロジェクトを行う
このとき「集団の境界」をまたいだ集団が生まれている
この「橋渡しする集団」がどんどん作られることを良いことだと考えている
異なるものの結合から新しいものが生まれる
なぜ「橋渡しする集団」が作られるといいのかというと、異なる集団に属している人が知恵を持ち寄ることによってより良い結果が得られるから
なので機会をたくさん作っていく、その中からいくつかが事前に予測できないような大きな成果につながる
コミュニケーションの効率化は「持ち寄る」コストを下げる
言語障壁の低下もここに関連する
日本語英語翻訳だけではない、日本語の中にも「一見同じ日本語を話しているのに会話が通じない」がある、これらの見えにくく今まで解決に投資されてこなかった言語障壁をなめらかにしていく
2025年時点、社会の計算はどうアップデートされつつあるか
詳細に説明すると何百ページになってしまうのでいくつかの事例をピックアップして紹介する。Audreyらの「Plurality」はより詳細なカタログになっている。
2025年現在起きている大きな技術トレンドはLLMの発展と、世界コンピュータの発展だろう。
LLMの発展
https://gyazo.com/8aed1a6ee239c672d1e504cdb48d0e9e
情報を複製し配信する技術の発展により、一人の人が大勢の人に考えを伝えることが容易になった。
しかし大勢が情報発信すると、一人が受け取る情報量が膨大になり情報洪水で溺れてしまう。
人々が積極的に発信する社会や会社では、大勢の意見を聞くことを支援する技術が重要になる。
日本では複数の政党がこのシステムを活用して、国会での質問にこのシステムで作った可視化を使ったり、政策を補強することに使ったりしている。
Talk to the Cityや広聴AIのしくみ
https://gyazo.com/c8d972283424ae2476ca9b8b9a836acf
人々の発言などのデータからLLMによってまず細粒度の表現を抽出する。
データは文字列のリストであればなんでもよい。過去の事例では、SNSからAPIで特定のキーワードを含むものを抽出したりとか、Google Formでお題に対する意見を集めるとか、Google Mapの特定地域範囲に書かれたレビューを収集するとか、Steamでゲームにつけられたコメントを集めたりとかが行われてきた。
「細粒度の表現」は、短文で、たとえば「意見」である。他には「質問」や「批判」や「問題意識」などを抽出することもできる。何を抽出するかはLLMに対するプロンプトで指定できる。Talk to the City以前はこれが「キーワード」や「トピック」であった。短文になることで情報量よりよく意味を保持できるようになった。
次のステップでLLMを用いてその短文を数千次元の高次元空間に埋め込む。これが可能になったので、前段で細粒度の表現としてキーワードではなく短文を抽出することが有用になった。
以降は多様なバリエーションがある。たとえばUMAPを使って次元削減をして2次元の散布図として可視化する、クラスタリングをかけて「似た意味の意見」のグループを作る、そのグループがどういう意見のグループかの解説をLLMで生成する、など。
広聴AIの特徴は階層的クラスタリングによってグループの掘り下げを可能にしたことと、密度の高いグループに注目する機能をつけたことである。し
pro-social media
例えばインターネット上の電子掲示板をイメージしよう。大雑把に言うとインターネット上で100人集めたら1人くらい個人攻撃や棘のある物言いをする人が出現する。一度そのような人が現れると、100人中3人くらいは感情的に反論し始めたり、「そういう物言いは良くない」とたしなめ始めたり、棘のある言い方でその主張をした個人を攻撃したりする。このサイクルが回り始めると生産的な議論をする場は破壊されてしまう。
XなどのSNSはユーザのリアクションを最大化する方向にタイムラインのアルゴリズムを調整した結果、過激で感情的な反発を産むような投稿がより多く表示されるようになってしまった。Audreyらはソーシャルメディアが社会の絆を壊す方向に参加して「anti-social media」になってしまったと表現する。
もっと生産的な議論が行われるようなソーシャルメディアの設計ができないだろうか。これがpro-social mediaの考え方
たとえばアメリカの非営利団体The Computational Democracy Projectが開発し、Audrey Tangが台湾で使って有名になったPolisは、意見に対して人々が賛成反対投票をし、異なる意見グループから共通して賛成されるものに注目が集まるように設計されている。過激で分断を煽るような意見はすぐに表示されなくなる。 両方に共通する「リプライさせない仕組み」が重要。Paul Grahamの"Life is Short"でも、オンラインでの議論を「攻撃」と感じて「防衛」のつもりで反論することの有害さが語られている。この考え方はデジタルに特有のものではなく、たとえば裁判所における調停手続きでは当事者が直接議論をするのではなく交代で調停委員と面談を行う「別席調停」が行われています。 人間が他人を直接的に攻撃できないUXやインセンティブのデザインをすることによって、よりよい議論が行われるようにする。
熟議の支援
ブロードリスニングはLLMを用いた「大勢の声を聞く力の増強」だ
pro-social mediaはLLM以前の技術を用いた、人々がよりよく議論をするためのデザインだった
LLMの発展によって、人々がよりよく議論をすることを直接的に支援するシステムが可能になる
世界中で研究されている
たとえばGoogle DeepMindによるHabermas Machineは人々が投稿した意見と短い批評を入力として、AIがグループの「合意文」を生成し、人間がランクづけ投票と批評を繰り返し、AIが改訂をする仕組みです。
Science誌に掲載された論文(2024)では、Habermas Machineを使った実験で、AIが生成・改稿した合意文は人間モデレーターの作った合意文より情報量・明確さ・公平性で高く評価され、参加者の意見の分断も縮小しました。
日本ではデジタル民主主義2030プロジェクトによっていどばたシステムが開発されています。これも2025年の夏段階で複数の政党が活用しています。 このシステムはAIのインタビュアーが個々人に対してチャットでヒアリングをします。AIからの質問に答えることで人々が自分の考えを言語化することを手助けするわけです。
ヒアリング結果の使い方は、目的によっていくつかのバリエーションがあります。
例えば、ヒアリング結果からそれぞれの人が何を問題だと感じているのか、そしてどうやって解決できると考えているのかを抽出し、それをレポートにまとめて共有することができる。実際の応用例ではYouTube Liveで150人が5分間AIと議論し、230の課題点と解決策が抽出された。
別の応用例ではあらかじめドキュメントがある状態で、そのドキュメントに対して人間がAIに質問したり、AIに改善案を提案することができる仕組みが運用された。この場合も、何を疑問に思っているのか、何を問題と感じているのか、どういう提案をしたいのかがAIのインタビュアーとの会話によって深掘りされる。この実験では9000件の改善案が提案され、大規模な社会実験として顕著な結果を出したが、改善案がMCPを介してダイレクトにGitHubのPRとして作られる構成だったためにAIによるまとめが困難というボトルネックも明らかになった。
デジタル民主主義2030プロジェクトではこの実験結果を参考にした次のバージョンの設計も議論されており、誰でも参加できる政党中立的なオープンソースプロジェクトなので興味がある方はぜひ参加してみてほしい。
Ethereumというワールドコンピュータ
もう一つの大きな技術革新がEthereumという新しいコンピュータの成立である。資本主義がドライブした技術革新の流れを振り返ってみよう。
世界規模の分業・協力を生み出した資本主義
今日の国際貿易の約 70 %は部品やサービスが国境を何度も越えるグローバル・バリューチェーンで構成されている。世界各地のお互いに顔も知らない人々が、資本主義の媒介によって分業・協力してものづくりをしている。
Audreyらは協力には深さと広さのトレードオフがあると考えている。資本主義はとても広く、浅い協力の形である。
技術の進歩によって、これをもっと深い協力にしていくことができるはずだと考えている。
https://scrapbox.io/files/68abf3f915304bc63b3d46cf.png
2015年、Ethereumが稼働し始める。「地球規模に分散しつつ同一の状態遷移をする汎用計算機」の誕生である。
先行して2009年に稼働したBitcoinは「お金」を作ることを目的として設計されたが、Ethereumはコンピュータを作ることを目的として設計された。
ブロックチェーン上に世界で共通の「状態」が書かれて共有され、EVM(Ethereum Virtual Machine)がバイトコードを決定論的に実行し、全ノードで同一の状態遷移を導く。
これによって、誰でも参加することができ、誰かが参加している限り止まることのない、地球規模に分散し論理的に単一の計算を行う「世界コンピュータ」がうまれた。
よくWeb3技術は中央集権的でないことが特徴などと言われるが、Ethereumの作者Vitalik Buterinの考えは違う。ハードウェア的に非中央集権であって、どのコンピュータも単一障害点にならない。政治的に非中央集権であって、特定の人や組織が管理者ではない。それでありながら論理的に中央集権的で、状態遷移が統一的に合意され、システム全体が一つのコンピューターのように動作する。これがEthereumのもたらしたものだ。(参考: 中央集権の3つの軸) これによって「グローブ=地球」という文字通りの意味でのグローバル変数が誕生した。
執行の自動化
かつて人間の社会では「契約」が紙で行われていて、その契約が破られたときには民事訴訟を行い、最終的には国家権力によって強制執行を行う仕組みが使われてきた。この契約や民事訴訟のコストはとても高い。
一方で、EVMのコードとして「どういう条件になったらどういう処理を行うか」を実装することにより、特定の国家の権力や法律知識に依存しない形で契約の自動執行が可能になった。これがスマートコントラクトである。
これ以前もソフトウェアサービスは全世界に対して機能を提供することができていた。スマートコントラクトの登場は「運営者やその存在している国家の信頼」に依存しない契約に対する信頼の源泉となった。(脚注: ただしスマートコントラクトの自動執行が及ぶのはオンチェーンの状態までで、現実世界の出来事や権利移転を伴う場合はそれを行う主体に対する信頼が必要になる)
Web3の文脈で一時期話題になったNFTは、前述のグローバルスコープに作成されたオブジェクトであり、その所有とは「所有者フィールド」にあなたのアドレスを書くということだ。所有者だけがこのフィールドを書き換える転送関数を実行できるようにバイトコードが記述されている。
これはスマートコントラクトのシンプルな応用例の一つである。所有者だけが他の所有者に所有権を渡すことができる「所有権移転」の仕組みが、特定のサービス事業者や国家に依存することなく実現されている。
ただそれだけのことにすぎないのだが、著作権などの法的権利の取得と誤認させたり、まるで将来値上がりすることが必然であるかのように宣伝する人によっていくつかの詐欺事件が発生することとなった。
予測市場
このスマートコントラクトによる信頼が、予測市場を活性化させることにつながった。
匿名で市場を作り、匿名でお金を賭け、自動執行により負けた人から取り立てて買った人に渡すことが可能になった
世界最大規模の予測市場Polymarket(2020~)では、例えば2024年のアメリカ大統領選でどちらが勝つのかに対して36億USD以上のお金が動いた https://gyazo.com/7e4782c51c8cda9ffe98457e2bffb4be
SNSでの投稿は、誰でも無責任なことが言えてしまう。自信がなかろうが自信がありそうに強い主張をすることができてしまう。しかし予測市場では自分の意見に対していくら賭けているのかが自信のシグナルになる。
これにより予測市場はSNSとは違った「自信情報付きの集合知システム」となる。
日本ではリアルマネーを用いた予測市場は賭博とみなされるリスクがあるため、他の国ほど予測市場が注目されていない。ゲームマネーでの予測市場でも有用であるという議論もあるが、筆者は現金化可能な予測市場の存在が社会にとって有益だと思っている。なぜなら、SNS上でろくに調べもしないで過激な意見を発信してすることの現金利益を、きちんと事実を調べて予測をして自信情報つきで発信することの現金利益が上回れば、社会の中にきちんと調べてきちんと考えることのインセンティブが生まれるからである。きちんと調べてきちんと考えて発信することは社会の利益になる行動だからそれにインセンティブがあるほうが好ましい。
日本では2018年に国会で「IR実施法案(別名:カジノ法案)」が成立し、また以前から競馬やパチンコが社会的に容認されている。何が賭博で何が賭博でないかの境界は自明ではないし、立法機関によって変えられうる「現時点の決め事」にすぎない。
意思決定のアルゴリズム
1人1票で投票して多数決するのも一つのアルゴリズム 予測市場で決めようと言うのも一つのアルゴリズム
現時点でも商品先物市場は商品の需給を予測して将来の価格を決める仕組みだと考えられる
これをもっと多様なものに広げるのが予測市場
資本主義が一国の境界を超えて地球規模に広がっている現代においては、すでにお金がいろいろなものを決定している
しかし、お金の力で物事が決まるのは好ましくないと思う人も多いだろう。
いいとこどりをするアルゴリズムが、先述のPlurality本の著者であるGlen Weylによって提案されている
1人1票ではなく、票のコストが2乗のオーダーで増える仕組み。多数派の専制を防ぎつつ、少数派でも強い関心があれば影響力を行使できる。 人々から意見の強さのデータを集める場合に、たとえば「意見の強さを1~100で回答して」と聞くのでは、大きな数を書いたほうが自分の意見を通すのに有利なのでみんな100と書いてしまい、正確な情報を収集する手段として機能しない。そこで何らかの関数によって「意見の強さ」に応じたコストを徴収することが必要になる。この論文は意見の強さを$ xとするなら、$ x^2のコストを徴収することが適切であることを示した。
Quadratic Votingのコスト支払いを寄付金の額とした、クラウドファンディングと投票のいいとこどり。
寄付額の平方和に比例してマッチングプールから資金配分が行われる。これによって広い支持を集める公共財ほど多くの資金が届くようになる。
Gitcoin Grantsはこの仕組みを採用して2019年にスタートし、2024年12月までに累計 6,665万ドル超の資金をオープンソースプロジェクトに分配した。 平方根の意味の直観的説明
https://gyazo.com/7de5f0eae25deb83ad3ae020628a2fd5
QFでは1人の100万円(=1000投票力)と100人の100円(=10投票力)が同じ力を持つ
$ 1人 \times \sqrt{1000000円} = 100人 \times \sqrt{100円}
https://gyazo.com/b7b59fcc5cc066b7adaf26378206f3f6
100万円を100人で分けたら1人1万円
A案がいいと思う人が、B案がいい(=100円までならだせる)と思ってる人100人に1人あたり1万円払ってる形
B案がいいと思う人も、100人で分担してA案がいい1人に1万円払っている形
つまり社会の中には両立しない意思決定の選択肢があり、どれを選んでも必ず「自分の意見が通らない人」がいる。この「自分の意見が通らない人」に対してより多くの補償金を出せる側の意見が採用される
Vitalik Buterinはさらに進んだ公共財ファンディングの仕組みを2021年に提案した。それがRetroactive Public Goods Fundingである。これは「将来の有用性を予測するより、既に役立った成果を振り返って合意形成する方が簡単」という考え方で設計されている。
Optimism の RetroPGF で大規模な社会実験が行われており、3年間で1.2~1.5億USDの資金分配が行われている。
従来の公的助成や公募では「これを作れば価値があるはず」という計画の段階で審査して評価するため、審査員に未来予測能力が求められる。事業者側に「そのやり方では発注者が思ってるような成果は出ないぞ」という知識があったとしても、それを正直に伝えるメリットがないため、情報を隠してプロジェクトが過大評価されるように仕向けるインセンティブがある。一方でRPGF は公共財としての成果が出た後に審査して報酬を出すため、実装や普及を頑張るインセンティブが生まれる。
もちろんプロジェクトを始めるときに先立つお金がなくて始められない問題があるので、QFで広く種まきをし、しばらく経って芽が出て育ち始めてから元気そうな芽にRPGFで肥料をやるようなハイブリッド形式が良いとVitalikは考えている。
Futarchyは2000年にRobin Hansonが提案した、予測市場を取り入れた統治システムである。 2014年にVitalikがEthereum Foundation Blogで紹介記事を書いたことで注目されるようになった。
Futarchyはまだ最大でも1600人程度の規模でしか実験されていない。社会を計算と捉えてアップデート方法を考える方向性の最先端に近いものであるので紹介しておく。
基本的なアイデアは予測市場によって政策の良し悪しを判断することである。Futarchyは何を目指すかを投票で決め、どう実現するかを予測市場に委ねる。具体例で考えよう。目指すKPIが「5 年後の 1 人当たり可処分所得」と決まったとする。具体的な政策として下記の3つがあるとしよう。 A: 法人税率を30%に据え置き
B: 法人税率を25%に減税
C: 法人税率を20%に大幅減税
この3つをそれぞれ「この政策が採用された場合の5 年後の 1 人当たり可処分所得」を予測する予測市場にする。一定期間後に最も高い可処分所得が予想された政策が自動執行される。
これはお金を投票権とする投票に対する懸念を緩和する。これが単なるお金を投票権とする投票の場合、企業のオーナーがたくさんのお金で投票して適切な水準以上に法人税率を下げてしまうことが懸念される。しかし予測市場の場合、たくさんお金をかけた人は「5 年後の 1 人当たり可処分所得を高くすること」に強いインセンティブを持つことになる。目的に協力することが促されるメカニズムなのである。
2025年時点で社会を変えつつある技術的潮流を解説してきた
雑にAIとWeb3などと要約される領域であるが、その表現は解像度が粗すぎて有害だと考えたのであえてこの言葉を使わなかった。
計算設計のパラダイムシフトは人々の会話を計算可能な対象にし、人々の間にかつて存在しなかった形のコミュニケーションの構造を生み出しつつある
世界コンピュータによる自動執行は、国境を越えて人間を介さずに人間を動機づけする方法を生み出した
ここから未来について考えよう
2025年の万国博覧会では「人類は“むかし賢かった生き物”で、これからは賢さは“ちょっとしたおまけ”に過ぎない」というストーリーが語られて話題になった。
これはつまりAIが人類の賢さを越えつつあり、人類は万物の霊長という立場を手放しつつあるということ。個人的には自分が生きている間には「人間は一番賢い存在ではないよね」とほとんどの人が感じるようになる時代が来ると思っている。
これはある一瞬に人間から全てのものが奪い去られる「0%か100%か」の話ではなく、人間が今後数十年の間にAIに色々なものを移譲していく話。
今まで人間がやっていたことの一部はAIがやるようになり、少し人間がやり続けることも残り、そして人間は何か新しいことをするようになる。
https://gyazo.com/78a6a9aa82f0d0f623829f63637a7c73
長期的な未来が「そういう世界」になることは間違いないが、この「そういう世界」は解像度が低い
点だと考えてしまいがちだが、実は幅がある
https://gyazo.com/b7dd5bb4d745ad34170d065c4d41f9c6
遠くの星だけを見て歩いて穴に落ちることがないように気をつける必要がある。
つまり、現在の現実においての、次の一歩がどうあるべきかしっかり見て歩かなければいけない。
そのキーになるのは目的関数の設計だと思う。
目的関数の設計
Futarchyは興味深い応用だが、何らかの問題の特効薬にはならないと思う。
なぜかというと「目的」の決定方法を「投票」としたところが、難しい問題の先送りだからだ。
Futarchyによる進歩は、目的達成手段のアルゴリズム的な自動決定とスマートコントラクト的な自動執行にある。目的の決定方法は手付かずのまま残されている。
投票の対象にできるようなコンパクトに言語化された目的関数は、可能な目的関数の空間のごく一部に過ぎず、おそらく最適解はその空間にない
選択肢AかBかと議論しているとき、しばしばAとBの重み付き和の選択肢が無視されている
「A 100% B 0%」や「A 0% B 100%」の方が表現がシンプルで理解しやすいためにその両極端に注目が集まりがちだが、現実には「A 70% B 30%」や「A 40% B 60%」のようなブレンドが最適解であるケースがある。
人間の思考能力に対して負担が重過ぎて最適化が実行されていないので、重みの自動調整機構が必要。
筆者は選択肢の重みの自動調整があったとしても足りないと考えている。
適切な社会の目的関数は、選択肢の重み付き和で表現できないような空間にある
それは個々人の価値観が人それぞれ異なっていることに起因する
トレードオフにある属性
どこが最適なバランスであるか個々人の価値観によって異なる
たとえばスマートフォンの「カメラの解像度」と「価格の安さ」にはトレードオフがある。
https://gyazo.com/eb354d53b78e3b88717b0932285530b0
カメラ解像度の高さと価格の安さのトレードオフ
個別の属性だけ見て「解像度が高い方がいい?」「安い方がいい?」と聞けば誰でもYesと答えるだろうが、世界一解像度が高くてかつ世界一安いスマートフォンは実在しない。人々は入手可能なスマートフォンの選択肢の中から選ばなければならない。
このときに人それぞれ各属性をどれほど重要視するかが異なっている。なので世の中には多様な商品があり、人々は一通りの商品ではなく人それぞれ異なった商品を買っている。
これはつまり個々人の幸福度の関数において各属性の重み付けが異なっているということ。
効率と自由
個々人の幸福追求の自由度を高めることは、暗黙に個人を定義域とする目的関数を仮定している。個々人が自力で自分の目的関数での最適化を行うモデルである。
社会全体の全体最適を目指すことは、暗黙に社会全体を定義域とする目的関数を仮定している。この目的関数がシンプルであるとき、人それぞれの価値観の違いはノイズとみなされる。
個々人の価値観の違いを尊重するなら、社会全体の目的関数は人間の人数に比例する数の項がある関数になる。
目的関数をどう定めるか
人間が言語的に考えて設計すべきか?それとも大量のデータを集めて学習によって獲得すべきか?
ルールベースの設計が機械学習に負けてきた歴史を考えると筆者は後者の方がいいのではと感じる。
それ以前に、人間には個々人の価値観の違いを尊重した目的関数の設計ができないのでは。
自分の価値観に影響されて、他人に自分の考える幸せを押し付けてしまう。
長期的に見ればAIが人間より賢くなり、AIが人間を統治するようになるだろう。その場合もAIは「人々が幸福になるように」統治するだろう。この「人々の幸福」の定義を一部の人間が行うのは価値観の押し付けになってしまう。
なのでこの時までに「人々の幸福」という目的関数を、一部の人が決めつけるのではない形で構成できる仕組みがなければならない。
ハンドルを握って慎重に進む
両極端は効率100%も自由100%もおそらく悲劇的な未来につながっている。端以外にもいくつもの悲劇的未来が引力を発生させていてる。たとえるなら道の両端は崖であり間の道にもいくつもの落とし穴があるようなものだ。
https://gyazo.com/5cd0defbde524a26d7c83a2275eed30a
道の両橋は崖であり間の道にもいくつもの落とし穴がある
人間がしっかりハンドルを握ることが大事。なんとなくで進んでいると両側のどちらかに落ちてしまう。これは国家の効率的運営のために国民の自由を犠牲にするタイプの国家が強い軍事力などに裏打ちされた影響力を獲得する未来と、個人の自由のために国家の統制を緩めすぎた結果として私有財産を蓄えた個人が資本主義によって強い影響力を獲得する未来だ。
また周囲をよく観察して危険に早く気づいて避ける必要がある。
よく観察するために、認知能力を増強する必要がある。
望遠鏡が発明されたらのぞいてみる側に立つのがよく、望遠鏡をのぞかずに批判していた側に立つのは良くない。
人類がが望遠鏡の発明で遠くを見る能力を手に入れたのと同様に、人類はブロードリスニングを発明して、他の大勢の気持ちを知る能力を手に入れた。
これを活用しながら、落とし穴を避けてより良い未来へと進まなければならない。
まとめ
「社会」を「人間による計算」として捉えて、コンピューター科学の視点から、どのように改善していけるかを考えた。
歴史を振り返ると、ホレリスのパンチカードからENIAC、そして現代のLLMやEthereumに至るまで、人類は「社会で行われる膨大な計算」を外部化し、より高速・高精度な計算へ置き換えてきた。
こうした計算力の拡張は、軍事や行政のみならず、選挙や政策立案、公共財へのファンディングといった 社会の根幹にも影響し始めている。
大きな影響を与えつつある技術の一つであるLLMは、計算パラダイムの転換が強みの源泉となっていることを歴史を追って確認した。
ルールベースの設計パラダイムは、重み付き和=学習のパラダイムに敗れ、画像認識・翻訳・対話などで人間を超えた性能に至りつつある。
また、世界コンピュータEthereumによりQuadratic Funding/RetroPGF/Futarchy など、資金と意思決定を結び付ける実験が進行している。これらは「何を目的とするか」という根本課題を残しつつも、「実行」のコストを劇的に下げている。
今後、この「目的」の設計が大事になるだろう。人間の多様な幸福がAI統治下で保障されるためには、大勢の人から多元的な価値観を取り込み、動的に重みを調整できる仕組みが不可欠である。ブロードリスニングや予測市場を望遠鏡にして、私たちは“落とし穴”を避けつつハンドルを切らなければならない。
ホモサピエンス最後の仕事として、新しい社会のOSを設計しよう。