樋口先生
いつもありがとうございます。
文書クラスター分析をする時、オプションで
・最小/最大 出現数による語の取捨選択で、
最小出現数を”2”に設定しました。
しかし、クラスターの結果(特徴)をみますと、語の出現が全体で1回の語も含まれています。
これはなぜでしょうか。
ためしに”1”でやってみましたが、クラスターに含まれる文書数は
”1”と”2”で大きく違っていました。
(たとえば、クラスター1の文書数が、”1”の場合は96、”2”の場合は24と、”2”では格段に減少。)
よって、何かが違うのだとは思うのですが、どのように違いは反映されているのでしょうか?
森田@京都