Re: 文書クラスターの設定と結果について (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.557] Re: 文書クラスターの設定と結果について 投稿者:HIGUCHI Koichi  投稿日:2009/12/26(Sat) 18:40:30

こんにちは、樋口です。書き込みありがとうございます。

「クラスターの結果(特徴)」というのは、おそらく「抽出語探索」画面で各
クラスターに特徴的な語をご覧になっているのだと思います。この「抽出語探
索」画面では、どのようにしてクラスター分析を行ったかには一切関知せず、
それぞれのクラスターに特徴な語(=それぞれのクラスター内では出現確率が
高くなっている語)を検索しております。したがって、クラスター分析時に出
現回数1の語を除外した場合でも、「抽出語探索」画面では出現回数1の語がリ
ストアップされる場合があります。

設定(最小出現数)の違いは、クラスターの変化/グループ分けの変化として
反映されているのですが、それを確認する方法としては、各クラスターに分類
された文書を確認したり、あるいは各クラスターに特徴的な語を検索したりと
いった方法しか、今のところ思いつきません。

よろしくお願いいたします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)