こんにちは、樋口です。書き込みありがとうございます。
> 次郎(人名)|全体:1(0.143)|共起:1(0.333)|Jaccard:0.3333
> 花子(人名)|全体:2(0.286)|共起:1(0.333)|Jaccard:0.2500
> となるはずです。
えっと、そうでしょうか? どうしてこうなるのか、それぞれの数値をご説明
いただけますか? たとえば0.143とは何を何で割った値でしょう?
> ちなみに、この「関連語検索」に関しては、文(センテンス)を単位
> として行うことはできますか?(抽出語リストの「出現回数」のほうと
> 合わせることはできますか?)
文(センテンス)を単位にすることはできます。ただし、その場合もあくまで
「いくつの文に出現するか」を数えますから、「出現回数」とは別のものとな
ります。1文に同じ語が2回以上出現している場合、異なる数値になります。