共同注視
現在のディープラーニングによる画像認識では、画像から得られた高次の特徴量を使って、写っているオブジェクトが何かを識別することはできても、個々の特徴量である色や大きさ、角度、状況などを言葉と紐付けるのは容易ではない。人間の場合、赤ちゃんのときに言葉を覚えていく際、現実世界のオブジェクトの、形や大きさ、色などを、どういった順番で言葉と紐付けるかの優先順位が決まっていることが知られている。また、親の視線が向かった先を一緒に見る「共同注意」によって、親がどの対象のことを言っているのか同定しやすくなっている。つまり、「高速に学習するための仕組み」が人間には組み込まれている。そして、我々の社会のなかにも、たとえば、子どもの遊ぶおもちゃや絵本、また大人の子どもに対する語りかけやインタラクション、そして、保育所や幼稚園などでの教育にも、学習を促す仕組みが埋め込まれている。