次元の呪い
パターン認識
Search
パターン認識
#機械学習 入力から一番近いデータ(「辞書パターン」)のに識別 非常にシンプル 考える事 どのようなを用いるか クラスが異なると大きく違うのが嬉しい クラスが同じならあまり変化がないのが嬉しい 次元数が高すぎると、かえって性能劣化することも(「」) (上二つは、相反することも多い) どのように距離を測るか , (一般化して距離) ベクトルの特定の方向に重みを持たせたり(ex: 二次元ベクトルの縦方向だけ倍にするとか) 等方的距離でいいのか? 極論を言えば、パターン認識はパターン間の距離の学問 距離はいろいろな(ほぼ無限の)定義ができる をどう準備するか 各クラスの重心点のみ? 境界部の点のみ? 全部のデーターを使う? (効率に問題あり) 亜種 ...