Bluemo's Brain

Search

Search IconIcon to open search

情報科学の達人映像処理研究

Last updated Unknown Edit Source

    #pKineto #情報科学の達人

    UNISALを授業映像にかけてみた

    • 意外と上手くいきすぎている
    • ↓の計画がだめに
    • さあどうしよう
    • これを使った上で、授業映像の重要度評価をするとか?
      • UNISALとかのネットワークの一部切り取ったりできたら面白い

    20200319会議

    20210312

    202101021

    • 映像処理のことは取り組めなかった
    • /kineto/Kinetoとは 一般向け説明文を書きました
    • 「授業映像」ではなく「共有黒板」という捉え方
      • Jamboard, Miroの延長線上に置く

    20210115 Meeting

    20210105 Meeting

    • やったこと

      • とりあえずスライド/黒板上に増えたものの「大きさ」を評価したい
      • image
        • スライド変化のタイミングを検知して、変化前後の差分を取る、その上でdrawContours
          • 30フレームごとに変化をチェックしている
        • 全パーツがばらばらになっちゃう
          • ぼかしつけてみた(Gaussian Blur)
      • OCRで文字を文字としてくくる
      • image image - ↑でいうと数値とかはそんなに重要じゃ無いかも
        • 黄色で囲まれている部分が、変化を検知した部分
      • 分かったこと
        • スライド変化とアニメーション変化時で、別々の対応が必要
        • スライドの場合、アニメーションがゆっくりだと各フレームの差分がスレッショルド以下になることも
        • スライド中に突然映像とか出されると困る
        • ⭐️変化の大きさを測る方法がムズイ
          • ただdiffのmean取るだけだと問題あり、ばらつき
          • というか物体が占める画素数に左右されすぎる
          • ex: 白背景の上に、地が白い図が出ても検知できない(変化したピクセル数が小さいので)
        • 変化を知る方法もむずい
          • アニメーション変化は問題ない、スライド追加が困る
          • スライド追加はそれを検出して場合わけかな
    • 学校の先生に相談

      • 黒板で文字サイズはかえない方が良いと言われている(らしい)(教師共通のノウハウ?)
        • どちらかと言うと重要度の表現には色を使うと言っていた
        • これ知っていればOCRとかも楽になるかも
    • 方向性

    • 先生に色々聞いて事前知識得る

      • 色々: 飛ばせるところとか(話す速度との対比など)
      • 速度変える根拠になる
    • 研究として

    20201202 Meeting

    • 重要なフレームを切り出す研究はいくつかある

      • ホワイトボードの画像から選んだりとか
    • 各frameの重要度を評価みたいなものは無い?

      • 速度を変えたいので、ほしいのはこっち
    • あと、「必要な部分を選ぶ」というより「いらない部分を省く」アプローチは少ない

    • そもそもelastic timelineの考え方が珍しい?(数ヶ月考えてるとあたりまえに見えてくる)

      • elastic timelineの研究が、牛のやつとContent-aware –しか見つからない
    • 仮説:書き込んだ内容の大きさは重要度?

    • 相談

      • 他の要素と掛け合わせて速度いじりたい
      • どう掛け合わせる?
        • シンプルな加算/乗算より良い方法がありそう
    • 後からみた時の要約にも

      • 遅刻でも不参加でも
      • 要約頑張っても追いつかない場合どうするか

    20201118 Meeting

    • 対象となりそうな映像

      • 実写の授業映像
      • スライドベースの授業
      • 授業で使う資料映像(多様)
      • (範囲を絞るべき?)
        • 絞るべき
        • リアルと講義は性質が違う
          • スライドベースだと、文字とか図表とか
          • 音声が重要になりそう
            • 動画像: 3次元
            • 音声: 1次元 (軽め)
            • ベクトル化できれば同じ枠組みに
          • リアルタイム性のある場合は深層学習難しめ
            • 動画処理はとくに
    • Goal: このグラフの線を曲げる

      • 速度を変える
        • 速度を変えても内容理解に影響のない部分を見つける
        • 人間がどう感じるかが評価基準になる?
      • 不必要な部分を飛ばす
        • 映像要約系のものを応用(弱くする?)
      • 先人の情報を使う
      • その他の思い付いていない方法もあるかも