Re: 関連語検索での「共起」の列の条件付き確率につきまして (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.3513] Re: 関連語検索での「共起」の列の条件付き確率につきまして 投稿者:HIGUCHI Koichi  投稿日:2018/02/27(Tue) 17:53:20

こんにちは、樋口です。書き込みありがとうございます。

それで正常な結果です。

全体で「太郎」は、3段落中の3段落に出現します。つまり全文書中に「太郎」
が出現する確率(前提確率)は100パーセントです。

それに対して「花子」が登場する2つの段落(文書)に注目してみましょう。
「太郎」は2つの段落中、2つに出現しており、ここでの出現確率(条件付き確
率)は100パーセントです。

マニュアルに記載があるように、KH Coderが「関連語」として表示するのは、
前提確率よりも条件付き確率が大きくなっているもののみです。


ただ、こうした前提確率と条件付き確率の比較にこだわらずに、すべての語を
表示したいというご要望もあろうかと思います。その場合は、KH Coderの最新
版3.Alpha.10dをご利用ください。そして「関連語検索」の画面で「フィルタ
設定」をクリックし、「条件付き確率が低下する語も表示」にチェックを入れ
てください。

※この設定項目、正確には「条件付き確率が向上しない語も表示」と書くべき
でしたね。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)