階層クラスター分析

「プログラミング」及び「開発」関連用語集

カテゴリー: 統計  閲覧数:394 配信日:2016-09-07 10:03


概要


最も似ている組み合わせから順番にまとまり(クラスター)にしていく方法
・近いものから順番にくくる
・途中過程が階層のように表せる

長所
・予めクラスター数を決める必要がない(近いものから順番にくくるため)

最終的には?
・樹形図(デンドログラム)ができる


処理の流れ


1-2.構成要素を表す「点」(例えば顧客ひとりひとり)が分布している中から、2点間の距離が最も近いペアを同じ集団とする
3-5.さらに、互いに距離が最も近い点同士から順にグルーピングしていく手続きをひたすら繰り返していく
6.最終的に全体をいくつかの集団にまとめることが出来る

1.全ての「点」同士の間の「距離」を計算する (N個の点があると、N(N-1)/2回の計算をすることになる)
2.全ての「点」同士の間の「距離」を比較し、最も「距離」が小さな「点」同士を、統合した一つの「グループ」とする
3.統合して新たに作った「グループ」と、その他の「点」(または他の「グループ」)との間の距離を計算する
4.新しい「グループ」を含め、統合されずに残っている全ての「点またはグループ」同士の距離を比較し、もっとも「距離」が小さな「点またはグループ」同士を、新たに統合する
5.(3.)と(4.)を繰り返す
6.全ての「点」が一つのグループに統合された時点で終了する