[掲示板へもどる]
一括表示

  [No.2552] 関連語検索について 投稿者:松原  投稿日:2016/07/28(Thu) 17:23:18

度々ご質問にお応え頂きましてありがとうございました。
関連語検索において、「全体」と「共起」というのは何のことでしょうか。
「全体」が登場した数で、「共起」が同時に出現した数かと思ったのですが、出現回数をみるとそうではないようですね。


  [No.2554] Re:「関連語検索」画面の数値 投稿者:HIGUCHI Koichi  投稿日:2016/07/29(Fri) 00:24:30

こんにちは、樋口です。書き込みありがとうございます。

> 「全体」が登場した数で、「共起」が同時に出現した数

おおむね、そのような感じです。

ただ、語が登場した回数(TF: Term Frequency)ではなく、いくつの文書に登
場したのかという数(DF: Document Frequency)を表示しています。また共起
の列は、いくつの文書で共起したのかという数値です。したがって、1つの文書
の中に同じ語が2回3回と出現していても、あくまで「1文書」というカウントに
なっています。

「KH Coderの本」(5刷)では148ページあたりに、この画面の表示内容につい
ての説明がありますので、よろしかったら併せてご参照ください。
http://amzn.to/1kJGVh5