樋口先生修士論文執筆にあたり、KHcoderを活用させていただいております。基本的なことかもしれませんが、前処理完了後にメイン画面に表示される「Database Stats」における「異なり語数(使用)」の値と、記述統計>出現回数の分布における異なり語数(n)の値が違います。それぞれ何を指しているのでしょうか。また、度数分布表の度数1の出現回数には、抽出語リストの頻出150語のもっとも出現回数が多い語よりも、多いものがあります。以上2点について、ご教授くだされば幸いです。よろしくお願いいたします。
申し訳ございません、後半の質問については、マニュアルを読み直したところ解決いたしました。追記ですが、異なり語数(使用)が7000語、異なり語数(n)が約6000語という大小関係です。
すみません、元データの異なり語数と、それをもちいて度数分布のグラフをつくったときのプロット数なので、一般的に差が発生するのは当たり前だと今気づきました。解決いたしました。お騒がせしてすみません。より一層慎重に進めて参ります。
度々失礼いたします、プロット数ではありませんね。メイン画面をみたら、異なり語数(使用)が7102(6346)となっており、その6346が、度数分布の異なり語数(n)と一致しておりました。こちら見逃しておりました。この7102-6346=756語は、頻出150語で除外されているものと同様なのでしょうか。
解決いたしました。自分で取捨選択して捨てた語のぶんですね。お騒がせしました。マニュアルなどフル活用して慎重に進めて参ります。