こんばんはkenshiroです。返信ありがとうございます。
ありがとうございます。確かに「抽出語×文書」の表よりJaccard係数で類似度の行列を作るのが良さそうですね!
ここで、例えば共起ネットワークのjaccard係数の計算方法はkh coder内では、マニュアルのp47の様にコンコーダンスの結果を用いて行っていますか?
それとも2つの対象の語が共起した文書数を2つの語のどちらかでも現れている文書数で割ったものですか?
最後にですが、関連語検索ではコーディングファイルで全ての語を登録しても類似度のjaccard係数がある単語しか表示さないのでしょうか。
すみません、何卒間違って理解してる部分が多いかと思いますが、よろしくお願いします。