AI時代の女神は、あのスカヨハ 2024.06.09
https://gyazo.com/4a24935c9d961c8075b72fa0bf68fc70
2024年5月7日、Appleは、新型のタブレットiPad Proを発表したが、そのコマーシャルで大非難を浴びた。これまでずっと文化創造の支援者と思われてきたAppleが一転して文化の破壊者だと罵られるほどの大失態だった。
Appleがそのような袋小路に陥った翌週の5月13日、今度はOpenAIがGPT-4o(オムニ)での応答に利用される「声」を発表したが、この「Voice Mode」が問題となった。映画『her 世界でひとつの彼女』で使われた声にそっくりだったからだ。
ここでこの二つの出来事に注目したのは、どちらも近未来のAI時代に向けて、シリコンバレーがずいぶん前のめりになっていることの現れと思えたからだ。AIというテクノロジーの登場によって、競争のステージが変わりつつあることを示唆する出来事であり、今という時代の兆候でもある。AIはそれくらい戦況を変えるゲームチェンジャーとして流通し始めている。
Appleが新型iPad Proを発表する際に使ったのは「Crush!」というCMだった。名前の通り、楽器やAV機器、ゲーム機、さらには絵の具と、今まで人類が利用してきた「創造や表現のための道具」たちを軒並み「クラッシュ(破壊)」するものだった。
それも巨大なプレス機によって少しずつ圧力をかけながら粉砕していく、ショッキングなものだ。楽器の中には、ギターやトランペットだけでなくピアノのような大きなものまで含まれていた。それらが一様にプレスされながら破壊された挙げ句、最後にそのプレス機を引き上げたところに現れたのが新型のタブレットだった、というオチだ。
メッセージは明確だ。これまで人類の進歩を支えてきた文明の利器である各種ツール、加えてそうした利器に纏わる文化的な記憶のすべてが、新しいiPad Proに圧縮されて収められており、したがってこのタブレットさえ用いれば、あらゆる文化を創造し享受することができる、というものだ。
コンバージャンスの権化であり、マルチメディアの真の実現である。デジタル技術が一般化する1990年代から語られてきた夢をついにAppleは実現した。いやAppleだからこそ実現できた、というメッセージだ。
だが、そう主張するための表現としてはあまりにも拙かった。この映像は、見方を変えれば、歴史の中で人類が文化を築く上でともにあった「バディ」たちを圧殺したのだ。そこには、創作に携わる者が感じる相棒としての楽器、ツールへの愛着は感じられない。創作行為は道具無しでは行えない。そのような素朴な感覚をAppleはもう感じることができない。なにか大事なものがAppleから失われたと確信させる表現だった。その結果が、SNS上での非難の嵐だったのである。
そうして残ったのが、どうしてこんなひどい所業をAppleはできたのか?という問いだ。
その答えは、きっと、業界トップのAppleでさえ、無慈悲なまでにビジネスの進化を加速させるほかなくなったからなのだろう。競争のステージを加速させること、その加速に変わらずトップランナーのまま加わり続けること。そんな加速へと駆り立てられる源泉が、AIの襲来である。
2022年末にChatGPTがお披露目されて以来、2011年にローンチされたSiriは明らかに時代遅れの代物となった。ただのレスポンスとチャットではコミュニケーションのレベルが違う。その事実はApple自身も正しく認識しており、その慌てぶりは、鳴り物入りで始めた自律自動車の開発を停止し、そのAIエンジニアたちをジェネラティブAIの開発に配置換えするほどである。
Appleといえば、基本的にスタンドアロン志向のメーカーだ。ネットワークではなくあくまでも端末を起点にしたサービスを中心に開発してきた。個人のエンパワーメントが基本目標だが、その端末志向が、ジェネラティブAIの時代になって枷になりつつあるようだ。ジェネラティブAIの利用は、今のところ、ネットワークを介しているからである。
同社が開発してきたのはあくまでも個人が使うツールとしてのガジェット=端末だ。その意味では、彼らの姿勢は最初期のMacの頃から変わらない。インターネット以後に登場したiPhoneですら本質は、インターネット以前のPCにある。ビジネスモデルもPC時代に準じている。
インターネットが普及し分散コンピューティングにパラダイムシフトするかと思っていたところで、AppleはPCの上位互換としてのスマートフォン、すなわちiPhoneを開発し、それらを個人の日常に密着した本来あるべき真のPCに変えてしまった。
iPhoneでは、モバイル・コンピューティングが分散コンピューティングよりも優先された。結果、Appleは、Apple Storeを通じて、iPhoneで利用されるアプリを御するゲートウェイのポジションを確立した。提供者が個別にアプリを開発し、それらをApple Store経由でiPhoneにインストールするモデルだ。インターネットのオープンなブラウザ文化とは異なる、アプリ主体のクローズドなサービス・エコシステムが築かれることになった。
だが、ジェネラティブAIの登場で、改めてこのクローズドモデルに風穴が開くのかもしれない。
一方、OpenAIの騒動は、スカーレット・ヨハンソン(「スカヨハ」)の物言いから始まった。GPT-4oで使われた音声「Sky」が映画『her』でスカヨハが演じたAI音声と似ていたからだ。早速スカヨハが使用の停止を要請し、OpenAIも直ちにそれに応え「Sky」の利用を停止した。
「Sky」の音声は、スカヨハ以外の女性の声を収録し処理したもので、決してスカヨハの声に似せようとしたわけでないというのだが、しかし、「Sky」の応答を聞いて、『her』におけるスカヨハの声を思い出さない人はいなかった。
驚くことにこの映画ももう10年前の2013年に公開されたものだ。言い換えれば、10年前の『her』の世界が2020年代になって実現に近づいたことになる。当時はAI開発前夜であり、AIの稼働する近未来を描いたAI映画が続々と公開された頃だ。
それは同時に、シリコンバレーを中心に開発されるテクノロジーを楽観的に受け止められることのできた最後の時でもあった。2016年の「ポスト・トゥルース」の登場以後、テクノロジーに対する姿勢は反転し、手放しに礼賛できるものではなくなった。
だが、それでもアルトマンのようなテクノロジー開発の現場にいるギークたちは、いわば『her』の世界の実現を夢見て開発を進めていた。でなければ、わざわざスカヨハに似せた声を合成したりはしないだろう。良くも悪くも、スカヨハの声が、AI アシスタントの標準ボイスとして多くの人たち(ギークなど)のあいだで当たり前のものになってしまっていた。
アメリカのSF映画はしばしば、サイエンスといいながら、その実、創作や実装を夢見た、宗教的とも思える情熱を伴うファンタジーを描き、同時に、その中で描かれた「いまだ現実にはない、その限りで未来の」科学技術の成果が、やがて現実のものとして「実現する」、そう確信した素振りを見せる。予見的であり予言的。単に科学的なだけでなく宗教的なのである。
今回の一件で『her』もそうした映画の仲間入りを果たした。『2001年宇宙の旅』の「HAL9000」のように『her』のスカヨハボイスも殿堂入りしたのである。
『her』でも明らかにされたように、ネットワークが前提のAIシステムでは、たとえそのAIシステムが自分のために呼びかけてきたとしても、それは決して、たった一人のあなたのための存在にはならない。あくまでもそのように偽装しているだけのことだ。むしろ、そこで気づくのは、そうしたあなただけにを演出する上で、声による囁きが極めて有効であることだ。
その声の先に、声の主たる者が控えているようにユーザーの方が勝手に想像を逞しくしてしまう。つまり、人間の側の認知システムをも組み込んだ上でリアリティを仮構する仕組みなのだ。軽く #サイケデリック である。だが、自分向けのサービスをカスタマイズしてくれるバディは、決して、自分ひとりの占有物ではないのである。 個人向けの端末を旨とするAppleは、果たして「あなただけ」のバディAIを、iPhone上に構築してくれるのだろうか。こうしたAIからのプレッシャーの中、Appleも前のめりになって事業を加速させなければならない。その願望ばかりが前面にでた結果生まれたのが「Crush!」なる広告だったのかもしれない。
翻って、ここで問われているのはフェティッシュという問題である。
村上春樹の『羊をめぐる冒険』には「耳」専門のモデルが登場していた。それは、消費社会を彩るパーツとしての「耳」や「目」、あるいは「指」だった。今回、同様に「声」が、情報化された消費社会のフェティッシュの源泉として大いに登録されたということだ。一昔前にボーカロイドのブームがあったが、あれがもっと人間的な声に薄められた形で復活したといってもよいのかもしれない。
視覚を伴わない「音声」は、新しいメディアが登場する際、その扱いの容易さから真っ先に利用され、視覚情報がまったくないがゆえに、むしろ「想像を逞しくさせる」ことで、新参のテクノロジーを「メディア」へと転じさせるカンフル剤となる。
裏返すとGPT‐4oは、スカヨハ似の声を得たことで、ただのAIというテクノロジーから、人の心をざわつかせる「メディア」へと変容する扉を開いた。そういえば『her』の中で、スカヨハ声のAIに恋をする、ホワキン・フェニックス演じるバツイチ中年の主人公の仕事は、グリーティングカードに添える手紙の文章のゴーストライターだった。こちらも「文字」という、反芻することでいくらでも想像を広げられるメディアだった。
声を得たことでAIはテクノロジーからメディアに転じるのである。
振り返れば、インターフェイスの変化は、シリコンバレーの権力の配置を常に変えてきた、最もわかりやすい「地殻変動」といえる。AIが新たな震源地なのだ。テクノロジーとしてはカテゴリーが異なるものの、人間とのやり取りの界面(インターフェイス)を形成するという点で、同系の断裂的変化を示してきた。
たとえば、大まかに今までの流れを整理すると次のようになる。
https://gyazo.com/b61edf9b1dab9e2dfdd0c3cba10eb338
面白いのは、おおむね10年程度で、新しいインターフェイスを形成するテクノロジーが登場していることだ。
広くコンピューティング・パラダイムの変動因子として、インターネットに次ぐものがAIである。だからこそ、インターネットの覇者となったGoogle、あるいはAppleが急速に慌てている。Web 2.0の情報エコシステムも、スマフォのモバイル・コンピューティングも、ともにAIの登場で書き換えられそうだからだ。
少し古い話になるが、インターネットブラウザ「Netscape」の登場に対し、それまでのスタンドアロンPCの覇者であったMicrosoftが突貫工事で独自のブラウザである「Internet Explorer」を用意したときの様子とそっくりである。
IT産業が依拠するコンピューティング・パラダイムが根こそぎ書き換えられるときの恐怖。今まであったビジネス基盤の底が抜ける不安をGoogleもAppleも感じているはずだ。なにしろ、彼ら自身がそうやって今ある覇者の地位を築いてきたのだから。その意味では、OpenAIと組むことでMicrosoftがAI開発レースの先行組に名を連ねているのも、捲土重来とはかくや、というべきものだ。
Web3という中身が実際に何を表すかは不明だが、しかし、AIインターフェイスが全面に出てきたことで、「分散ネットワーク」による計算資源のダイナミックな運用が進むことは間違いないようである。その意味で、IT企業の競争ステージは大いに変わりそうだし、それにあわせて、ユーザーの生活シーンの組み立ても変貌する。
一つだけ確実なのは、本当はネットワークのどこにいるのかわからないものによって、自分たちの日常生活があれこれ水路付けられている、という感覚が増していくことだろう。ますます「レッドピリング」の現実味が増していく。
『マトリックス』のように、すでに全方向から包囲されているものの、あまりにもそれが徹底しているためその包囲網に気づかない。気づくためには「レッドピル」を飲まざるを得ない。その「気付け薬」はこの先、何になるのか?
そんな状況も含めてGoogleもAppleも皆、焦っている。AIの登場で、インターネットの秩序が大いに変わりそうな情勢にあると、シリコンバレーの誰もが思っている。いわゆる「デッド・インターネット理論」と呼ばれるもので、AIによってインターネットは息の根を止められる。
だからこそ、誰もが焦り、たとえば冒頭のAppleのように、これまでの会社の立ち位置を反転させかねないメッセージを、ビジネスの利得重視から公表してしまう。スカヨハの声がギークの欲望の集結として無意識のコンセンサスのように推されてしまう。
これからの数年は、iPhoneが登場した2007年や、ブラウザが登場した1995年のような情報社会の転変期となるのだろうか。その時、AIは私だけのバディとなるのか、それとも誰にも等しく接するマザーになるのか。どちらにしてもその時、スカヨハの声が君臨していそうだけれど。