自然言語処理
Natural language processing
人間が通常使う言語を、解析、合成する処理
問題
人間は自然に言語を習得してしまうが、その原理を誰も説明できない。
コンピュータに自然言語の仕組みを教える必要がある。
自然言語は場当たり的に発展してきたので、綺麗な構造になっていない。
複数の言語がある。
表記法が複雑。特に漢字圏では数千から数万の字が存在する。
単語が複雑で極めて多数存在する。
1つの意味に複数の単語があることがある。(同義語)
1つの単語に複数の意味があることがある。(多義語)
スラング
文法が複雑
倒置法
意味論が複雑
文脈に強く依存する
定型句のようなものが存在する
1つの単語に複数の意味が含まれる。(暗喩なども含む)
時代、年代によるブレ