人間は少ないサンプルからでも学習できる?
ピタゴラスイッチに「テレビのジョン」というキャラがいて、テレビの形に犬の顔や耳などがついているのですが、娘(1歳10ヶ月)がそれ見て「わんわん」と言うようになった。 明示的に犬とラベル付けして教えていないので、犬の概念の汎化ができてるんでしょうが、リアルな感じでないキャラクター(しかもテレビみたいな形で犬とはほど遠い)でも対応できているのはかなりの汎化能力。 これまで見てきた犬は、図鑑等を含めても、「匹数」としてはそこまでめちゃくちゃ多いわけではないと思う。犬とラベル付けして教えてないことも多いだろうし。それでもテレビのジョンを犬といえるほどの汎化ができる。
ただ、匹数は多くなくても、一匹一匹について、静止画で一回だけ見るとかではなく、動画像として、いろんな角度、いろんな大きさの犬を連続的に見ているはずなので、データとしてはものすごい数なんだろうな。ある種のコンテキストを含めて学習してるということかもしれない。