<論文ログ> Synchronization of Lecture Videos and Electronic Slidesby Video Text Analysis

授業映像の文字を認識して、スライドとシンクロさせる技術

文字認識(OCR)は二つ方法がある

1. Geometry-based approach

2. Texture-based approach

Geometry-basedの方は、ノイズに弱いけど実装楽で効率も良い

授業映像の場合は背景そんな複雑じゃないだろうから、geometric-basedをこの研究は用いている

補完とかして解像度を上げる、その後二値化とかしてOCRに突っ込む

解像度を上げた方がOCRが上手く行ったというのが研究のキモ？

そうやって出て来た文字を使って、スライドとマッチをする

スライドのタイトルと本文を分ける

先にタイトルをOCR

タイトルがスライドと似てたら、その後本文もOCRしてチェック