凝集型クラスタリング
- だんだん周りのを巻き込んでいく感じ、
- 木をビジュアライズすると、高次元のデーターでも分類をビジュアライズできる、何層目で分類するかをそれで決める #Pythonで始める機械学習 #教師なし学習
Search
用途は主に二つ データーの PCA() k-means 強みは、入力次元の数と関係なくクラスタを扱えること(PCAなどは出来ない) 分布してる点を10クラスに分ける == 各点を10次元の成分()に分離する 例: {0,0,0,1,0,0,0,0,0,0} もしくは、各クラスタセンターへの距離を各次元に割り当てるとか 評価について 答えを使って検証する場合: ARI値などを使う ただ、↑ができるなら教師あり学習すればいい 答えを用いない方法: とか ただ、本当に合ってるかは人間の目で可視化されたデーターを見るしかない 自動でR値とか使って検証できる、と違って人間が評価するしかない、大変 #Pythonで始める機械学習 同じに属する = 同じラベル、という仮定...