<文献ログ> A bottom-up summarization algorithm for videos in the wild
映像
映像
は映像の世紀 映像を通して[時間]]と、人同士の、[[コンピューター]]()、との関係等を考えていた は群集統治の手段として映像を活用 ベルリン #魔法の世紀 [[ Comparison of Automatic Shot Boundary Detection Algorithms Based On Color, Edges...
既存手法
- Unsupervised vs Supervized
- 既存はtasksがindependent
やること
- まず映像を細かめにセグメント分け
- さすがに全フレームがisolatedな分けないし、効率のためにoversegmentする
- 次に、importance measure (frame “energy”)をはかる
- dissimilatiry E vs representativeness E
- dis: 前後のフレームと違い大きいほどE高い
- rep: 前後のフレームと似てるほどE高い
- 二つの和は、類似度についてU字形のカーブを描く感じかな?
- 最後にenergyを元に良いとこどりをする
- まず映像を細かめにセグメント分け
評価方法
- やっぱり主観的なものなので定量的評価はむずい
- Open Video Projectなるものがある
- SumMe, Tour20 datasetとかいうsummaryと元映像のセットのデータセットもある