<論文ログ> Synchronization of Lecture Videos and Electronic Slidesby Video Text Analysis
授業映像の文字を認識して、スライドとシンクロさせる技術 1. Geometry-based approach
2. Texture-based approach
Geometry-basedの方は、ノイズに弱いけど実装楽で効率も良い
授業映像の場合は背景そんな複雑じゃないだろうから、geometric-basedをこの研究は用いている 解像度を上げた方がOCRが上手く行ったというのが研究のキモ?
そうやって出て来た文字を使って、スライドとマッチをする
スライドのタイトルと本文を分ける
先にタイトルをOCR
タイトルがスライドと似てたら、その後本文もOCRしてチェック