<論文ログ> Synchronization of Lecture Videos and Electronic Slidesby Video Text Analysis
Last updated
Unknown
Edit Source
授業映像の文字を認識して、スライドとシンクロさせる技術
OCR">[文字認識]は二つ方法がある
Geometry-basedの方は、ノイズに弱いけど実装楽で効率も良い
- 授業映像の場合は背景そんな複雑じゃないだろうから、geometric-basedをこの研究は用いている
補完とかして解像度を上げる、その後二値化とかしてOCRに突っ込む
- 解像度を上げた方がOCRが上手く行ったというのが研究のキモ?
そうやって出て来た文字を使って、スライドとマッチをする
計算量削減のために、
- スライドのタイトルと本文を分ける
- 先にタイトルをOCR
- タイトルがスライドと似てたら、その後本文もOCRしてチェック
https://dl.acm.org/doi/epdf/10.1145/957013.957080
#文献ログ