Salient Object Detection in the Deep Learning Era: An In-depth Survey
https://arxiv.org/pdf/1904.09146.pdf
The rest of the paper is organized as follows. §2 explains the proposed taxonomies, each accompanied with one or two most representative models. §3 examines the most notable SOD datasets, whereas §4 describes several widely used SOD metrics. §5 benchmarks several deep SOD models and provides in-depth analyses. §6 provides further discussions and presents open issues and future research directions of the field. Finally, §7 concludes the paper
- ニューラルネットワーク
ニューラルネットワーク
基本の回帰モデルを表すと↑になる これの層を増やしたり、間のユニットを増やすことで学習 各矢印が、重みwを持っている、全部違う値 学習によって調整される それだけだとただの回帰と同じ、だから、やを使ってフィルターをかける みたいに、して重みを0に近づけることもできる デフォルトはほとんど正則化しない 最初は、乱数で重みを決める 学習した内容の解析が難しい、やる方法の一つは重みのヒートマップをみること パラメーター学習のには、や等が初心者向けにある #Pythonで始める機械学習 モデルが完成したら、実際にする時はこの計算をすればいいだけ、簡単 (xが入力、Wが各層の重み、yが出力、σが) 一つの層のたくさんあるのうち、一つがめっちゃ影響力強くなっちゃうことがある それを避けるために、ランダムにdropoutする ...
- ピクセルベースのやつと、CNN的なやつがある
- 教師のレベルによる分類
- 人間の視線とかのアノテーションベース
- weakなやつ(ImageNetみたいなやつの途中段階で物体のところがハイライトされる) #弱教師あり学習
- あと、Single Task Learning vs Multi Task Learning(MTL)という分類もある