LLMの均衡状態 (2026年版)
A: 以下の3形態に分離する (間もいっぱいある)
base model (低周波・広いドメイン)
大企業が大規模データでトレーニングした、文化・規範、あらゆるものをそこそこ含んで、低頻度(week~year)で更新されるモデル
これが社会規範そのものであり、ある社会で論理や主張が「まとも」かどうかはbase modelを納得させられるかで決まる
IT主権的にすごく重要…だけど国の数ほどは必要無いと思う 論理の積み重ねによって吸収できる幅も広いから、世界に数個ぐらいで十分かもしれない
広いドメインを扱えることは本質的にreasonableであることを意味する
ネイティブに学習されてない文化は「翻訳」コストを払い続けることになるが、それが際限なく増加はせず許容される
なにがなんでもsovereign modelに、とはならずに経済制裁とかのブロックぐらいで分かれる
base/specificの蒸留元、検証先としても機能する
人間もbase modelを使って新しいことを学習したり、ものを考えたりする
local model (高周波・狭いドメイン): これがfrontierになる
edge deviceで動作し、特定の人間や特定の情報・物理環境に暴露され続けるモデル
世界に大量にある
推論=学習、で特定のことを考えることに特化することで、高効率で、社会規範とは異なる試行を行える
これが言語とかを扱ってる場合は「AGI」っぽくみえるだろうし、物理を扱ってる場合は「本能」っぽく見える
アクションと体験が閉じててキャンセル不能ならそれは意識っぽくも見えるだろうし、そうじゃ無い使われ方だとあまりそうは見えないだろう specific model (低周波・狭いドメイン): 他のAI/人間がfrontierに至るためのツールたち
これは物理法則やゲームルール (低周波)を扱ってるからbase的だけど、ドメインが狭いやつ
物理やなんらかの法則をNNで圧縮・表現する、というパラダイム coding agent, ~ agentみたいな特定の作業とrewardで訓練された系
画像生成、動画生成など特定データの生成
使われ方は「すごいゲームエンジン」とか「すごいデータベースエンジン」と似た部類で、「ツール」枠に入る
知識が安定している周波数 x ドメインの広さ、の二次元で見ている
成立しないもの: 高周波・広いドメイン
あらゆる物事に対して最先端の返答ができるモデル
これはエネルギー効率が低すぎ・データアクセスが遠すぎで成立しない
しかし、実際にはASIではないものをASIとして崇めることは可能
大きいコミュニティや企業はbase-local, base-specificの間のようなモデルを所持するはず
内部の特殊なデータで鍛えられた特定のmodel
今で言う自動運転の世界モデルとかはこれに近い例
modelの機能は?
文字通り世界の一部のモデル
それはclassification (probabilityをくれる)かもしれないし、next token predictionかもしれないし、actionかもしれない
あるモデルに整合する「何か」を生成したり、整合度を評価することができる
(これはNNの機能そのもの)
実運用では複数モデル+データのハイブリッド構成が多用される。「特定のNNが全てを支えている」みたいな実装は減っていく。
B: Aへの到達経路
おそらく最もspeculativeなのは"local modelがfrontierになる"という部分
TTT (test-time training)系が最も有望だが、それに限らない
傍証
動物・人間の脳のエネルギー効率の高さ
主体による選択の結果、世界観が狭まっていくのと引き換えに判断が速くなる現象
TTTでは不十分で、weight自体を更新する必要がある
実際に計算コストかかってるのはweightだから、weightを更新しないと計算コストが増え続けてしまう (積み上がらない)
「contextをgradualにストレージ階層に押し込む」みたいなエンジニアリングはこれを手で設計してるとも言える
coding agentはlocalなのspecificなの?
難しいところ。coding作業というのがどの周波数領域に依存してるかによる。
今はbase model + 長いcontext (adaptation) + 外部化されたskill, で実現してる
おそらくこういうハイブリッド構成は増える
C: 経済・社会的implication
「ASI/AGIを先に開発した組織が世界を取る」みたいなことは起きない
上手いマーケティング、上手いビジネス、先行者利益、その程度の優位性に留まる
「新世界の神」はででこない
base model providerはハードウェア~NNを垂直統合してることろが有利
社会的に許容される幅広いデータアクセス、alignment、そういうものの比重が増えていく
コスト優位性と組織の強さの戦いになる
local/specific modelのニッチは大量に生まれる
D: データとLLMの同型性
LLMはactiveなデータ、データはLLMから実行能力を分離したもの
Aの三分類はデータに対しても適用できるし、これはLLM以前からこうなっている
base model: 百科事典、教科書
local model: 小さいコミュニティ・個人のメモ
specific model: 専門書