Re: 関連語検索での「共起」の列の条件付き確率につきまして (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.3505] Re: 関連語検索での「共起」の列の条件付き確率につきまして 投稿者:HIGUCHI Koichi  投稿日:2018/02/24(Sat) 12:42:19

こんにちは、樋口です。書き込みありがとうございます。

> 次郎(人名)|全体:1(0.143)|共起:1(0.333)|Jaccard:0.3333
> 花子(人名)|全体:2(0.286)|共起:1(0.333)|Jaccard:0.2500
> となるはずです。

えっと、そうでしょうか? どうしてこうなるのか、それぞれの数値をご説明
いただけますか? たとえば0.143とは何を何で割った値でしょう?

>  ちなみに、この「関連語検索」に関しては、文(センテンス)を単位
> として行うことはできますか?(抽出語リストの「出現回数」のほうと
> 合わせることはできますか?)

文(センテンス)を単位にすることはできます。ただし、その場合もあくまで
「いくつの文に出現するか」を数えますから、「出現回数」とは別のものとな
ります。1文に同じ語が2回以上出現している場合、異なる数値になります。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)