1973年
1973年、計算言語学を修めた天野は大学院を修了し東京芝浦電気株式会社に就職、研究生を終えた河田とともに上京し東芝総合研究所に着任した。 1973~1974年、天野は、ここで意味論の研究を、河田は国のプロジェクトである漢字OCRの研究を行った。 どういうプロジェクト? 増井俊之.icon
「工業技術院大型プロジェクトパターン情報処理システム4)の一環として,最近開発された印刷漢字OCR(委託先東芝)を代表例として,少し詳しく紹介したい」
東芝総研の坂井邦夫の複雑指数法、河田勉の四辺コード法で漢字を大分類し、電気試験所の飯島泰蔵氏の複合類似度法で最終的に認識した。 二千字にも上る漢字に一々、重い処理である複合類似度法を適用して認識することは当時の非力なハードウェアでは事実上できなかった。外形的特徴を用いた大分類で候補を選定することは必須であった。