非階層クラスター分析

「プログラミング」及び「開発」関連用語集

カテゴリー: 統計  閲覧数:351 配信日:2016-09-13 10:56


概要


階層的な構造を持たず、あらかじめいくつのクラスターに分けるかを決め、決めた数の塊(排他的部分集合)にサンプルを分割する方法

目的
・同じクラスターの中に属するサンプルはなるべく似通っているように、異なるクラスターに属するサンプル間ではなるべく違いがはっきりするようにすること

特徴
・サンプル数が大きいビッグデータを分析するときに適している
・「予め幾つのクラスターに分けるか」は分析者が決める必要があり、最適クラスター数を自動的には計算する方法は確立されていない

代表的手法
K-means 法