樋口耕一 先生
同じ苗字の樋口と申します。
KH Coderを使用させていただています。KH Coderは大変使いやすいですし、マニュアルも分かりやすいと思っております。まずお礼を申し上げます。
質問はバージョンの違いによるクラスター分析結果の相違についてです。
今年の1〜2月ごろ、バージョン2.beta.29gを使用して、頻度上位の63語の階層的クラスター分析を行い、9つのに分けました。Ward法、ユークリッド平方の条件でした。3月ごろには分析を一応終了しその後KH Coderを操作していなかったのですが、再度データの確認ということで8月ごろ同じデータを用いて同じ処理してみました。この時私のちょっとした操作のミスから旧バージョンが立ち上がらなくなりましたので、新たなバージョンをインストールして(3.beta.30c)同じ処理をしてみましたら、階層的クラスター分析の結果(語のグループ)が前と違っておりました。その他のデータ(語の出現数、以前のクラスター分析に基づきクラスターのコーディングをした後の各コードのクロス集計と類似度)は、問題なく1〜3月頃の分析結果と同じでした。
バージョンの履歴を拝見しますと、新しいバージョンは「ユークリッド距離やコサイン係数を使う場合、語の出現回数そのもの(粗頻度)ではなく、1000語あたりの出現回数(調整頻度)を計算に使うように修正した。」とありました。バージョンによるクラスター分析結果の違いは、このことの影響なのでしょうか。
お忙しいところ恐縮ですが、お教えくださると幸いです。