k-means法

教師なしクラスタリングということで k-means法を試してみました。

ブロブデータでやってみる

データセットからブロブを呼び出します。

このブロブをk-means法を使って分類します。

k-meansの条件としてクラスタの数を指定しますが、下記のようなエルボ法を使ってベストなクラスタ数を決定します。今回は３です。

k-meansの結果がこれです。うまく行っています。

エルボ法でベストなクラスタ数を見つけておきます。

５にしましょうか。

クラスタ数５の結果です。

１と３に固まっていますね。

ちなみにk-means　デフォルトクラスタ数8でやってみました。

さっきのクラスタ３は下の２，３に分割されてしまっていると考えます。

クラスタ数５に戻って、結果のヒートマップを確認します。

年齢層でみると、クラスタ１は30-35歳、クラスタ３は45-50歳というように離れていることがわかります。

次は職業です。クラスタ数１と３は大きな差がないので、今回のクラスタリング結果に対して職業の寄与度は低いのでしょう。