k-means法の短所

「プログラミング」及び「開発」関連用語集

カテゴリー: 統計  閲覧数:341 配信日:2016-09-21 08:52


初期値依存性


初期値(初期に選択される「核」となるk個のサンプル)依存性がある
・「同一データ」に対して「同一条件(距離など)」で計算しても、初期値が異なるだけで結果は大きく異なる

対策
・最適初期値での結果を採用
→ 良いクラスターを得るために、初期値を変えて何回か分析を実施し、平均クラスター内距離が最小になる初期値を選択する