樋口先生
いつもお世話になっております。KHコーダーを使用させていただきありがたい気持ちでいっぱいです。
心より感謝申し上げます。
さて、階層的クラスター分析の最小出現数につきまして、以前質問された方に対して、NO.1620で回答されておりました樋口先生がご執筆された著書(社会調査のための計量テキスト分析)のp.148を参考にさせていただき分析を試みております。
現在、以下の2つの分析対象ファイルをもとに階層的クラスター分析を行っております。
ファイル1:総抽出語数約8,000(最少出現数10)「〜したいグループ」
ファイル2:総抽出語数約1,000(最少出現数5)「〜したくないグループ」
実際、以下のような流れで分析。
・それぞれ、総抽出語数が異なるため、ファイル1は、5の倍数かつクラスター数を考慮し、最小出現数10で分析を実施
・しかし、ファイル2は語数が少ないため、最小出現数10では分析を実行できず、5の倍数の最小である5に最少出現数を設定し、分析を行う
・これらの分析でそれぞれのファイルの各グループの内容を表す特徴を掴むことができた
・しかし、2つのファイルで最小出語数が異なるのに、その結果を同じ土台で比較して果たしてよいのかという他者からの指摘
→このような流れで、階層的クラスター分析を行う際の最小出現数の最適な決め方について悩んでおります。
今後、論文等に執筆していく際、最小出現数の違いに関する補足説明はどのように行えばよろしいでしょうか?
ご多忙の折恐縮ですが、ご教示いただけると幸いです。田中