[掲示板へもどる]
一括表示

  [No.619] 階層的クラスター分析の枠囲みについて 投稿者:澤井 健  投稿日:2010/05/11(Tue) 14:05:26

樋口様、いつもお世話になります。
KHcoderを利用させて頂けるようになったことで、
社内でのテキストマニングとデータマイニングの利用度や、議論が活発になって参りました。大変感謝いたします。

さて、表題の件ですが、階層的クラスター分析の結果で、オレンジ色の枠でクラスターが囲まれますが、(2つ囲まれる時もあれば、3つのときもございますが)この枠囲み時のルール、ロジックはどのようなものでしょうか?

お忙しいところ申し訳ございませんが、ご指導いただけますと幸いです。よろしくお願い申し上げます。


  [No.621] Re: 階層的クラスター分析の枠囲みについて 投稿者:HIGUCHI Koichi  投稿日:2010/05/11(Tue) 18:21:12

こんにちは、樋口です。書き込みありがとうございます。

これといって高度な処理を行っているわけではなく、単に「指定されたクラス
ター数」に分割を行っているだけです。

樹状図に縦線を引いて切り離すことをイメージして下さい(オレンジの四角形
の右側の縦線がこの線にあたります)。指定されたクラスター数に分割するた
めには、どこに縦線を引いて切り離せばよいかを判断して、クラスターの分割
を行っています。

クラスター数が指定されない場合には、KH Coderが適当にクラスター数を指定
しています(数学的な意味での「適当」ではなく、ただの適当です)。現状で
は、語数を10で割って四捨五入したものをデフォルトのクラスター数としてい
ますが、これを語数の平方根に近々修正しようと思っています。

# まったくもって経験的な感触ですが、それくらいのクラスター数への分割で
# 解釈しやすい結果が得られることが多いためです。

なお、クラスター数をいくつにするか、すなわちどこに縦線を引いて切り離す
かは、結果を見ながら「調整」ボタンをクリックしてクラスター数を指定する
ことで、調節していただけます。
また分割が不要であればクラスター数として0を入力して下さい。

どうぞよろしくお願いいたします。


  [No.623] Re: 階層的クラスター分析の枠囲みについて 投稿者:澤井 健  投稿日:2010/05/12(Wed) 18:12:51


樋口様、澤井と申します。
お返事、誠にありがとうございました。確認させて頂きました。

語数の平方根でのクラスター分割の件、興味深い内容で私も参考にさせていただきます。

ありがとうございました。