Re: 外部変数の値のクラスタリング (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.838] Re: 外部変数の値のクラスタリング 投稿者:HIGUCHI Koichi  投稿日:2011/08/09(Tue) 12:00:11

こんにちは、樋口です。書き込みありがとうございます。

外部変数の値をクラスタリングするということですね。

もともとR上に存在するデータですから、改めて「座標を入力」する必要はあ
りません。R上で対応分析を行った後(No.825の[4]まで進めた後)、以下のコ
マンドを実行すればクラスター分析を行えるでしょう。

なお、一般的には、対応分析に入力したロー・データを用いてクラスター分析
を行うのが定石だと思います。すなわち、対応分析で圧縮する前の、生のデー
タを用いて分類するということです。この場合のコマンドは以下のようになる
でしょう。

#--------------------------------------------------------------------
library(amap)
plot(
    hclust(
        Dist(
            d,
            method="pearson"
        ),
        method="ward"
    )
)
#--------------------------------------------------------------------

それに対して、対応分析のプロット座標(成分スコア)をクラスタリングに用
いますと、単に「分類する」というよりも、「対応分析のプロット上で、どの
値とどの値が近くに布置されたのかを分かりやすく示す」という意味合いにな
るでしょう。この場合のコマンドは以下のようになります。

#--------------------------------------------------------------------
library(amap)
plot(
    hclust(
        Dist(
            cbind(c$rscore[,d_x],c$rscore[,d_y]),
            method="euclidean"
        )^2,
        method="ward"
    )
)
#--------------------------------------------------------------------

※クラスター化法や距離係数については必要に応じて変更してください。R上
で「help(Dist)」「help(hclust)」のように入力してエンター・キーを押すと、
利用できるmethod(クラスター化法・距離係数)を確認できます。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)