ディープラーニングのチューニングTips
情報α課題2: CIFAR10でCNNを訓練で思ったこと
- 「①モデルを調整して精度を高める」と「②汎化性能を高める」の両輪を回していく、みたいな感じのプロセスだな〜と思った
- accuracyとvalidation_accuracyのグラフをみて二輪の内進めるべき方を進める、という作業の繰り返しだった
- 正しいやり方なのかは分からんけど
from 東大1S情報α ディープラーニングのテクニック
- パラメータ初期値の決め方
- どういう初期値が良い?
- 学習後は0を中心に分布するので、元から0を中心にすると良い
- あと、次元が多いほどばらつきは小さい
- あとは、いい感じの正規分布でバラつけとけば良い
- この「良い感じの正規分布」がXavierの正規分布とかHeの正規分布
- 分布範囲が違う
- この「良い感じの正規分布」がXavierの正規分布とかHeの正規分布
- どういう初期値が良い?
- 勾配クリッピング
- 勾配の上限を定めておこう、というやつ
- 過学習防ぐ
- 正則化
- 大きいパラメータθを避けるため
- ドロップアウト(深層学習)
- ランダムに枝を消すこと
- 最近あんまり使わないらしい
- 早期終了
- なんかもう普通に過学習する前に止めちゃおう、というやつ
- バッチ正規化
- 正則化
- これらのテクニックは色々あるけど、