線形モデル
- 線形モデルは、多次元のデーターに対しては非常に強力
- Pythonで始める機械学習
Pythonで始める機械学習
...
- https://riptutorial.com/ja/machine-learning/example/23896/ロジスティック回帰とsvmの違い
#教師あり学習 #機械学習 #Pythonで始める機械学習
Search
...
#教師あり学習 #機械学習 #Pythonで始める機械学習
P(A|B)とかを活用した分類 P(クラスAの、全体における存在確率) * P(判断したいものの特徴が、クラスAに存在する確率) ↑を、それぞれのクラスでやる 一番有名なのは分類 少々簡略化しすぎだけど、わかりやすい https://qiita.com/ishizakiiii/items/07cc7e463dceb3efe1a1 過去のデーターの出現確率とかを使って、分類する と、多くの利点/欠点が共通 大規模なデーターセットのになる...
データーの表現の形を模索すること 主に、やなどのシンプルなモデルが影響を受ける 決定木とかはほとんど影響受けない、 NN, , とか受けることもある の重要な仕事 パラメーターの調整より重要なこともある 例: job変数の値が{student, engineer, chef}の三種の場合、One-hotで{1,0,0}のように表す それぞれに数字が割り当てられてる場合もある、それでも連続値ではない(順番に意味がない)から、そのまま数値として扱わないように注意 [ビニング]]化) 連続値を区切って、クラスにする 多項式特徴量 とかだと、xというパラメーターがあった時にx^2,x^3とかも追加すると曲線で分離できる 決定木とかだとむしろ性能下げるかも 累乗だけではなく、sin, cos, logとかも使える を描くデーターだとよく学習できるから、それに変形するために使ったり 自動特徴量選択 役に立つ特徴量を自動で選んで特徴量の数を減らすと、汎化性能が上がる 統計的な相関が高いやつを選ぶとか モデルを学習させて、そのモデルから特徴量の重要度を得て、重要だった特徴量を使ってさらに学習するとか ↑を繰り返すとか 専門家の知識を使う 統計データーからじゃ読み取れないけど、人間ならわかる知識もある それを考慮しながらエンジニアリングをしていく #Pythonで始める機械学習...