Googleの猫
Googleは、2012年に、「人が教えることなく、AIが自発的に猫を認識することに成功した」と発表た。
これを、Googleの猫という。
これは世界中のAIの開発者・学者に大きな衝撃を与えた。
その後の教師なし学習、画像認識の分野が急速に進むきっかけとなった。
概要
Google社の研究チームは、ディープラーニングという手法を用いて、YouTubeに投稿されたビデオの中から無作為に一千万枚の画像を取り出して、AIに学習をさせた。
その結果、AIが「猫が写っている画像を見分けられるようになった」と発表した。
この研究で特に注目されたのは、人がAIに「猫」という概念を教えたわけではない、という点。
1000万枚の画像を学習・パターン分析しているうちに、AIは画像内の特徴を認識し、自発的に分類できるようになった。
つまり、AIが独自で「グループ分け」、言い換えれば「認知」ができることが実証された
人がなにも教えていないのに(教師なし学習)、AIが試行錯誤を繰り返し、自力で猫を認知したということ。
ちなみに、人間のような全能型のAIを開発しようと思ったら、カギを握るのは視覚情報と聴覚情報です(味覚情報や嗅覚の優先度が低いことは、みなさんも日常生活の中で実感していることと思います)。
そして、聴覚情報に関しては、1990年代のパソコンソフトにも音声入力に対応したものがあったくらいですから、比較的早く研究は進んでおり、また、音声の正体は「周波数」「波」ですので、人が教えることで認識率を向上させることができました。
ところが、視覚情報となると、周波数のような単純なものではないので、多くの研究者が悪戦苦闘していたわけですが、そうした中で、人が何も教えていないのに、AIが勝手に猫を認識してしまったわけですから、それがどれほど凄いことかはみなさんも想像できるのではないでしょうか。
そして、視覚情報、すなわち「画像認識」は、今後のAIにおける基幹技術です。
自動車のオートドライブ(無人運転)にせよ、冷蔵庫が中の物を認識して自動的に牛乳や野菜を発注するにせよ、画像認識ができないことにはなにもはじまりません。
まさしく、2012年に歴史が動いたと言っても過言ではないでしょう。
最後に補足をしておくと、同時期に「人間の顔」を認識することにも成功していますが、なぜか「猫認識」ばかりが話題になって、人間の顔認識については紹介される機会が少ないことに触れておきます。
参考資料