Bluemo's Brain

Search

過学習

Last updated Unknown Edit Source

from 東大1S情報α 過学習

機械は、パラメータを訓練する時間を与えれば与えるほど複雑なモデルを考えようとする
- それをやめたい
- そういう意味では、結果に対してはオッカムの剃刀
  
  オッカムの剃刀
  
  必要が無いなら多くのものを定立してはならない。少数の論理でよい場合は多数の論理を定立してはならない。[[3]] — オッカムに近い? ...
  
  1/3/2023
  
  と同じ話をしている
逆に、人間はそういうことはなさそう
- 物事をシンプルに説明する
  
  物事をシンプルに説明する
  
  最近よくこれに近い物を見る ex: > ユーザーの要求をそのまま機能にすると役立たない物になってしまいます。デザイナーはユーザーの要求を抽象化して本来的な原理を見つける必要があるのです。例えば「直進したい」「左折したい」「右折したい」という要求に対して、3つのボタンではなく、1つのハンドルを提案できなければいけません。 pic.twitter.com/vCQRcX6WHE > @[manabuueno]] [August...
  
  1/3/2023
  
  ことへのモチベを持っているからかな
  - 一般的な法則を見つけたいモチベがある

Backlinks

ニューラルネットワーク

ニューラルネットワーク

基本の回帰モデルを表すと↑になるこれの層を増やしたり、間のユニットを増やすことで学習各矢印が、重みwを持っている、全部違う値学習によって調整されるそれだけだとただの回帰と同じ、だから、やを使ってフィルターをかけるみたいに、して重みを0に近づけることもできるデフォルトはほとんど正則化しない最初は、乱数で重みを決める学習した内容の解析が難しい、やる方法の一つは重みのヒートマップをみることパラメーター学習のには、や等が初心者向けにある #Pythonで始める機械学習モデルが完成したら、実際にする時はこの計算をすればいいだけ、簡単（xが入力、Wが各層の重み、yが出力、σが）一つの層のたくさんあるのうち、一つがめっちゃ影響力強くなっちゃうことがあるそれを避けるために、ランダムにdropoutするを避けるために #UdacityIntrotoDeepLearningwithPyTorch #ディープラーニング...

1/3/2023
教師あり学習

教師あり学習

 タスクと、タスククラス分類タスクには、2クラス分類と、多クラス分類がある yes/noか、a/b/c/d/eか回帰タスクは、連続値を予測する問題年齢とか、収入とか例えば、文章の言語を推測する時は、英語とフランス語の中間なんてない年齢を推測するときは、40も41も似たようなもの、誤差もまああり学習中に、に注意するを見つける低次元の情報セットの時の直感が、高次元のときに使えるとは限らない #機械学習...

1/3/2023
数学の美しさとは

数学の美しさとは

山中俊治 Shunji Yamanaka(@Yam_eye) 私たちが自然を通じて認識する「美しさ」には２種類ある。一つは景色や生き物から直接受け取る美的体験、もう一つはその背景にあるルールが見えた時に得られる美的体験。かつては前者はアーティストのもの、後者は科学者のものだった。 #多摩美術大学特別講義 https://twitter.com/Yameye/status/1462090326944923650?refsrc=twsrc^google|twcamp^serp|twgr^tweet で、美しいと言われるものこれ、自分が何が好きなのかと言うのとも関わってくるので追い求める意味ありそう #物事をシンプルに説明するをやっているこれ、要はと同じ議論か #決定論よりシンプルな議論になりそうだけど 20201229 なんで抽象化したシンプルな記述を求めるのかが今まで説明できなかったけど、最近「美」とかそういうのじゃなくてシンプルに便利ってだけなのかなと思って来ている https://scrapbox.io/villagepump/数学の学び方#6396bf11aff09e000019ea2b これ、というのか抽象化すると、シンプルな記述（脳で処理しやすい）でさまざまな複雑な具体を処理できるさらに、良い具合に抽象化すれば、未知の事象にも適応できるこれは多分確率の話で、因果の連なりがシンプルの方が起こりやすいという（因果の連なりって人間の認識にどのくらい頼ってるんだろう）「良い具合」が、における（避け） https://twitter.com/fukuso_sutaro/status/1418859563290402823?s=21 #自分...

1/3/2023
機械学習の検証方法

機械学習の検証方法

データーに偏りがある場合は、少ない方でとを測る R^2を使うは、モデルの正確さを表す(only) 0~1 1が完璧に適合(恐らく) とテストセットの値の差が大きい = よくない単純に2:8で分割するのではなく、それを何パターンも試す状況に応じて、いろんな分割方法がある特定のグループを全てテストケースに入れたいときとか膨大なデーターがある時に、全部は使わずに一部だけとるとか本の5.1に色々書いてある精度の数字を比べるだけでは足りない、実際の用途に応じてフレキシブルに例: 医療において偽陽性より偽陰性の方がやばいのは明らか、二つのミスを同じ重みで扱わないようにする #教師あり学習 #機械学習 #Pythonで始める機械学習...

1/3/2023
次元の呪い

次元の呪い

パターン認識を増やしていくと、クラスを分ける線を引く事自体は容易になるただ、容易になっているのは分割線のパターンがが増えるほど増えていくからその多くののうち多くは、未知のデーターには対応できないなので、実際にテストデータで試したときの結果は、次元を増やしすぎると下がっていくみたいなことが次元数でも起きる現象自体にあんまり共通点はない? #機械学習...

1/3/2023
決定木

決定木

決定木の分ける場所は、不純度がされるところに引く（計算できる）とか、とか、で不純度を計算する枝かりをして、防ぐ良い点結構いろんなスケール/タイプのデーターでいける順応性高い素人にも説明ができる木が作れる決められた範囲外のことは何もできない Tree predictionは、範囲外は何もできていない過剰適合がしやすいで、ちょっとデーターと特徴量を欠けさせた木をたくさん作る、その多数決をとることでめっちゃ精度高くなるも避けられる一番メジャーな回帰/分類の手法ただ、木のメリットである説明性は減るもある、パラメーター多いけどより性能良い事前枝刈りをした小さい木をたくさん組み合わせる #Pythonで始める機械学習...

1/3/2023
線形モデル

線形モデル

線形モデルは、多次元のデーターに対しては非常に強力つまり、に注意する必要がある () p67に良くまとまっているパラメーターは、アルファorCの調整が重要線形モデルは、基本的に非常に高速、予測も高速予測手法がわかりやすい課題としては、の意味が理解しにくいの数が、サンプルの個数よりも多いときに性能を発揮する https://riptutorial.com/ja/machine-learning/example/23896/ロジスティック回帰とsvmの違いは、分割する線の周りにスペースを取りたがる、は違う #教師あり学習 #機械学習 #Pythonで始める機械学習...

1/3/2023
過剰適合

過剰適合

=> ...

1/3/2023
過学習

過学習

from 機械は、パラメータを訓練する時間を与えれば与えるほど複雑なモデルを考えようとするそれをやめたいそういう意味では、結果に対してはと同じ話をしている逆に、人間はそういうことはなさそうことへのモチベを持っているからかな一般的な法則を見つけたいモチベがある...

1/3/2023