はじめまして。素晴らしいソフトのご提案を誠にありがとうございます。
KhCoderを使いながら様々な文章の解析を試みており、ゆくゆくは学会発表ができれば、と考えている新米教師です。
自分なりに考えているのですが、どうにもこうにも行き詰ってしまい、ここで質問をさせていただくことにいたしました。
もしよろしければ、ご教授いただけますと幸いです。
お尋ねしたいのは、表題の件につきまして、コーディングから作成される類似度行列は、対称行列として得られるのですが、
対称行列ではなくて下記の【例】ように、すべての組み合わせに対する値が行列で類似度行列を得ることは可能でしょうか。
最終成果物としては、csv形式もしくはエクセルの形式で得られれば、どのような方法でも大丈夫です。
----
【例】
列1 列2 共起度
語n1 語n1 1.0
語n1 語n2 0.113
語n1 語n3 0.224
・・・
語nr 語n1 0.114
語nr 語n2 0.424
・・・
語nr 語nr-1 0.979
語nr 語nr 0.322
----
つまり、語が全てでn個の場合、n(n-1)/2行の形でデータが入手できれば…とRを眺めたりしながら考えておりますが、行き詰ってしまいました。
お忙しいところ、恐縮ですが、お時間のあるときにご返信いただけますと大変ありがたいです。
よろしくお願いいたします。