急速に接近するAIとメタバース、そして5G 2022.03.11
https://gyazo.com/04d9545dea7af35727da729397274311
角川アスキー総研の遠藤諭によれば、「同じ時代に急速に育った一見全く無関係なテクノロジーはある日突然合体し、強力なニューテクノロジーに変貌する」という。
遠藤諭はたとえばそのような例として、「半導体とコンピュータ」をあげる。
確かに、半導体そのものとコンピュータの出現は全く無関係に行われた。
1890年のアメリカ合衆国国勢調査のために公募された結果、集計機(タビュレーティングマシン)が発明され、人間が13年かかると言われた計算を13ヶ月まで短縮することに成功した。これを最初の実用的なデジタルコンピュータ(自動計算機)の起源と考えると、これが電子化されたENIACの時代(1940年代)まで、たっぷり半世紀もかかっていることになる。
半導体の発明は1947年で、最初は真空管の代替品として作られた。この当時の真空管の主な利用用途はラジオやアンプ(増幅装置)であり、これらはもちろんコンピュータとは全く無関係だった。最初の半導体はトランジスタと名付けられ、1950年代には価格も下がり大量生産されるようになった。
半導体とコンピュータの関係が決定的になったのはトランジスタを満載した集積回路(IC)が発明されたことで、これで従来はビル一つとか部屋一つ分、トランジスタを使っても冷蔵庫何個分のサイズだったコンピュータが、親指大のマイクロチップに凝縮され、秋葉原で誰でも手に入れられるようになった。
大量生産されることが前提のテクノロジーは、大量生産されればされるほど安くなる。
つまり、ヒット商品に寄生するテクノロジーは進化しやすい。
たとえば、1980年代のコンピュータにとって、複雑な科学計算をするためのモジュールだったFPU(浮動小数点演算ユニット)は、出現そのものは早かったが、それより後に出現したGPU(グラフィックス処理ユニット)の方が先にゲーム機に搭載され、数億台オーダーで生産されることで爆発的に安価になり、進化が促進された。
GPUと全く無関係に進化していた人工知能が、2012年ごろに急速に接近し、人工知能研究が爆発的に進歩したのがここ10年の出来事である。もはや人工知能分野へのGPUの貢献を疑う人はいないだろう。しかしその裏側には、そもそもGPUの大量生産と低価格化という淘汰圧が効いていたのである。もしもゲーム機にGPUではなくFPUが先に搭載されていたら、今のような人工知能の進歩はなかっただろう。
同じことが、最近、全く無関係に進歩しつつある二つのテクノロジーを結びつけようとしている。
それがメタヴァースとAIに今起きつつあることだ。
メタヴァースの起源をどこに求めるかは諸説あるだろうが、1968年のアイヴァン・サザーランドのヘッドマウントディスプレイ(HMD)を挙げる人は多い。
ただし、HMDはずっと高価であり続けた。ディスプレイ技術や空間認識技術が進化しないと安くならなかったからだ。
21世紀に入り、ディスプレイ技術が真空管(ブラウン管)から液晶、有機ELへと進化していったことで、再びHMDの進化が再開された。それにはディスプレイ技術の未熟さをソフトウェアで補うという手法が併用されることもあった。初期のOculus Riftはそのようにして破壊的な低価格を実現した。
さらに大量生産される土壌としてゲーム機よりも遥かに製造数の多い機械、スマートフォンに寄生することでディスプレイ技術、プロセッサ技術、省電力技術が飛躍的に進化した。
スマートフォン向けに作られた技術のほぼ全てが現在のHMDに投入されている。
言ってみれば現代のHMD、そしてメタヴァースと呼ばれるムーブメントは全ての始まりであったサザーランドの最初期の研究目標への回帰と言える。サザーランドの研究グループには一つだけ全く省みられないものがあり、それが人工知能だった。
人工知能には羨望と失望のサイクルを繰り返すという性質があり、他の二つの分野の研究者は人工知能とは距離をとっていた。ところがゲーム機とスマートフォンによってGPUが飛躍的に高性能化すると、突如それまで全く失望されていた人工知能が急速に実用化された。HMDにも最新の人工知能技術が応用されている。
先日Meta社のマーク・ザッカーバーグが行なったプレゼンテーションでは、メタヴァース世界の中で言葉によって世界を構築するというデモンストレーションが行われた。
トーマス・エジソンは「必要は発明の母」と呼んだが、テクニウムからみればむしろ「発明は必要の母」となる。
たとえば、5Gネットワークを必要だと感じてる人は今現在ほとんどいないだろう。
しかし、1995年に自宅に光回線が必要と考える人は、同じくらいか、もっと少なかった。
なぜなら、1995年当時は、インターネットそのものが小さく、ダウンロードすべき情報も少なかったからだ。
ところが回線はどんどん広く太く高速になり、しかも値段はそのままか、少し高いくらいで普及していく。
通信量と比較すると相対的には回線の価格は下がり続けている。
この秘密は、そもそもあらゆるテクノロジーは短命であるということに原因がある。
通信回線を構成するテクノロジーは、数年で老朽化する。
それを構成する部品もすぐに製造されなくなる。すると、必然的に数年に一回のサイクルで通信環境を再構築する必要が出てくる。その際、新しい部品は常に高速かつ安価になっているので通信速度は上がってしまう。
しかし、通信が高速化したとしても、それを利用する目的がなければユーザーは恩恵を受けることができない。
これはインフラ側だけでなく消費者も同じで、常に携帯電話を数年サイクルで買い替える必要がある。
結果として、「携帯を買い替えたら、たまたま5G対応だった」ということが放っておいても起きる。
それがある程度進むと、今度は「5Gじゃないと成立しないコンテンツ(利用目的)」が登場する。
そのうちの一つとして期待されるのがメタヴァースだ。
メタヴァースは圧倒的に情報量が多い。これが通信大手がこぞってメタヴァースに投資する理由でもある。
反対に通信大手がAIへの投資に及び腰なのは、AIと5Gの関係性が見えないからである。
ただ、メタヴァースとAIは現在急速に距離を縮めつつある。
Meta社の示すビジョンは、AIがメタヴァース内の日常に入りこんでいる。
最近Meta社配下のFacebook Researchが発表したtextlesslibは、文字を使わない自然言語処理のためのフレームワークである。textlessとは、日本語の音声から直接、英語の音声に翻訳するようなことができないかという可能性を含めた研究である。それが実現すると、喋り方のニュアンスを残したまま先方の言語に翻訳できるし、逆に先方の喋り方を残したまま日本語で聞ける。
ザッカーバーグはSNSとAIというテーマに着目して何年も前から研究プロジェクトを支援しているが、なかなか上手い成果に結びついていない。それは彼の目線がもっと遠くを見ているからで、研究の方向性としては正しくても実用化されるまでには時間のかかりそうに思える。
ひょっとすると、この瞬間は全く着目されていない、5GとAIの融合の方が先に発生するかもしれない。
それを考えるのも面白そうだ。
Meta、ユニバーサル翻訳などメタバース構築に向けたAIプロジェクトを紹介
米Meta(旧Facebook)は2月23日(現地時間)、「Building for the metaverse with AI」(AIによるメタバース構築)と題するオンラインプレゼンテーションを公開し、メタバース構築のために取り組んでいる複数のAIプロジェクトについて説明した。
マーク・ザッカーバーグCEOは、メタバース構築にはハードウェアからソフトウェアまで、あらゆる範囲で進歩が必要だが、鍵になるのはAIだと主張した。ユーザーが仮想世界と物理世界の間をスムースに移動し、仮想世界をリアルに感じるためには、ユーザーとAIの間の「より豊かで深いコミュニケーションが必要」だと同氏は語った。
そうしたコミュニケーションを可能にするためのエンドツーエンドのニューラルモデル「Project CAIRaoke」を発表した。公開されたYouTube動画を見ると、音声で何でも相談できる会話エージェントというかAIアシスタントのようなもののようだ。
「Builder Bot」は、音声で世界を構築するためのbot。デモ動画では、アバターになったザッカーバーグ氏が「海岸に行こう」と言うと景色が海岸に変わり、「雲を足そう」「あそこに島を作ろう」などと言うことで環境を構築していく様子が紹介されている。
こうしたサービスに必要な技術の1つとしてザッカーバーグ氏は「真のマルチモーダルAI」を挙げた。マルチモーダルAIとは、大まかには、音声や画像、動画など、多様な種類の情報を利用して総合的な判断を行うAI。
MetaではマルチモーダルAI開発のアプローチとしてself-supervised learning(自己教師あり学習)を採用した。
メタバースでは世界中の人々が使う言葉や文化を超えて交流できなければならず、そのためにたとえオンラインでほとんど使われていない国語を話す人々も疎外してはならないとザッカーバーグ氏。そのための中間ステップとして、現在のように英語を介さずに数百の言語感で直接翻訳できるオープンソースのAIモデルを構築した。
1つは、学習データが少なくてもすべての言語を学習できる「No Language Left Behind」、もう1つはリアルタイム音声翻訳システム「Universal Speech Translator」だ。
これらの取り組みについて、具体的な実現時期などについては言及されていない。
ザッカーバーグ氏は「ほとんどのIT企業はテクノロジーと対話するための技術開発に重点を置いているが、われわれは人と人とが交流するためのテクノロジーを構築している」とアピール。安全で最高レベルのプライバシーを提供するAIテクノロジーを構築していくと語った。
https://www.youtube.com/watch?v=JnD6iRN9dt8