こんにちは、樋口です。いつも丁重なポストをいただき、大変ありがとうござ
います。
抽出語やコードのクラスター分析における、クラスター数の設定ですが、マニ
ュアルには書いていませんでしたね。すみません。
デフォルトの「Auto」では、抽出語(コード)数の平方根を四捨五入したも
のを用いています。これは完全なヒューリスティックスと言いますか、経験
的な感触と言いますかで、だいたいこれくらいのクラスター数への分割で、
解釈しやすい結果が得られることが多いように思い、設定したものです。
※以前、数値指標を使ってクラスター数を決められないか検討した記憶がある
のですが、あまり上手くいかず、現在の設定にしたような記憶があります。も
しKH Coderでの利用にお勧めの指標等ございましたら是非ご教示下さい。
なおflashClustにも、そうした便利な機能は無いと思います。クラスター分析
の高速化のためだけに利用しています。
次にSOMについてのリクエストも、大変ありがとうございます。
そういえば、まだバージョン3の頃にViscovery SOMineというものを使ってい
て、印象は良かったです。最近では、このソフト(のデータ量無制限版)は当
時よりも高騰している様子ですが…。
Rのパッケージをそのまま使ったのではできないこと(より優れたカラーリン
グ等)となると、一気に実現のハードルが上がるのですが(苦笑)、確かに
そういうことができれば良いでしょうし、ご要望をいただいた旨しかと覚えて
おきます。
丁重なフィードバックに重ねてお礼申し上げます。