樋口先生
早速の返信、ありがとうございました。
なるほど、操作に関しては理解ができました。果たして本当に10位上の単語が必要かどうか考えて、もう一度作業に臨みたいと思います。
現状では、比較検討するためといいますか、単語そのものを集めることが目的になっていますので、10年ほどのデータをそれぞれ年度ごとにわけて分析にかけています。アドバイスしていただき、ありがとうございます。
そこで、もう一つ質問があります。
以下、同一ファイル内での特徴語を選択した場合の結果なのですが、
コミュニケーションという言葉が抽出できているにも関わらず、後者においてそれが分割されてしまうのは、特徴的な語を出すという目的のために、重複しないようになっているから、ということなのでしょうか?
度々の質問、申し訳ありません。
1.txt
ゆ
.090
オブジェクト
.080
インタフェース
.040
コミュニケーション
.039
装置
.034
ム
.031
イチ
.030
リュウ
.030
盆栽
.030
キュー
.030
2.txt
コミュニケ
.125
ユ
.124
生物
.096
情報
.090
メ
.069
ル
.061
行動
.059
ション
.058
発生
.057
人間
.053コミュニケ
.125
ユ
.124
生物
.096
情報
.090
メ
.069
ル
.061
行動
.059
ション
.058
発生
.057
人間
.053