Re: Jaccard係数について (kenshiro) KH Coder 旧掲示板

こんばんはkenshiroです。返信ありがとうございます。

ありがとうございます。確かに「抽出語×文書」の表よりJaccard係数で類似度の行列を作るのが良さそうですね！

ここで、例えば共起ネットワークのjaccard係数の計算方法はkh coder内では、マニュアルのp47の様にコンコーダンスの結果を用いて行っていますか？
それとも２つの対象の語が共起した文書数を２つの語のどちらかでも現れている文書数で割ったものですか？

最後にですが、関連語検索ではコーディングファイルで全ての語を登録しても類似度のjaccard係数がある単語しか表示さないのでしょうか。

すみません、何卒間違って理解してる部分が多いかと思いますが、よろしくお願いします。