Re: 語の階層的クラスター分析 (樋口) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1381] 語の階層的クラスター分析 投稿者:樋口  投稿日:2013/08/25(Sun) 15:14:20

樋口耕一 先生

同じ苗字の樋口と申します。

KH Coderを使用させていただています。KH Coderは大変使いやすいですし、マニュアルも分かりやすいと思っております。まずお礼を申し上げます。

質問はバージョンの違いによるクラスター分析結果の相違についてです。

今年の1〜2月ごろ、バージョン2.beta.29gを使用して、頻度上位の63語の階層的クラスター分析を行い、9つのに分けました。Ward法、ユークリッド平方の条件でした。3月ごろには分析を一応終了しその後KH Coderを操作していなかったのですが、再度データの確認ということで8月ごろ同じデータを用いて同じ処理してみました。この時私のちょっとした操作のミスから旧バージョンが立ち上がらなくなりましたので、新たなバージョンをインストールして(3.beta.30c)同じ処理をしてみましたら、階層的クラスター分析の結果(語のグループ)が前と違っておりました。その他のデータ(語の出現数、以前のクラスター分析に基づきクラスターのコーディングをした後の各コードのクロス集計と類似度)は、問題なく1〜3月頃の分析結果と同じでした。
バージョンの履歴を拝見しますと、新しいバージョンは「ユークリッド距離やコサイン係数を使う場合、語の出現回数そのもの(粗頻度)ではなく、1000語あたりの出現回数(調整頻度)を計算に使うように修正した。」とありました。バージョンによるクラスター分析結果の違いは、このことの影響なのでしょうか。

お忙しいところ恐縮ですが、お教えくださると幸いです。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)