Re: 文書クラスターの設定と結果について (森田@京都) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.556] 文書クラスターの設定と結果について 投稿者:森田@京都  投稿日:2009/12/25(Fri) 22:58:41

樋口先生

いつもありがとうございます。

文書クラスター分析をする時、オプションで
・最小/最大 出現数による語の取捨選択で、
最小出現数を”2”に設定しました。
しかし、クラスターの結果(特徴)をみますと、語の出現が全体で1回の語も含まれています。
これはなぜでしょうか。
ためしに”1”でやってみましたが、クラスターに含まれる文書数は
”1”と”2”で大きく違っていました。
(たとえば、クラスター1の文書数が、”1”の場合は96、”2”の場合は24と、”2”では格段に減少。)
よって、何かが違うのだとは思うのですが、どのように違いは反映されているのでしょうか?

森田@京都


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)