こんにちは、樋口です。書き込みありがとうございます。
> 1.論文の共著者がA,B,C(後略)
Snowball Stemmerが1文字のアルファベットをどう扱うのか、ちょっとすぐに
は分かりかねますことが1つと、全角アルファベットをStemmerやLemmatizer投
入するのも良くなさそうです。
よって、茶筌を利用する設定のままお使いいただくのがお勧めです。また、デ
ータ・ファイルに全角アルファベットが入力されている場合、強制抽出の欄に
も全角アルファベットをご使用下さい。
それでも出現数が食い違うようでしたら、再度その旨お知らせいただけました
ら幸いです。
> 2. 共起ネットワーク(語と語)での重み付け
共起ネットワークでは、「共起するかどうか」にもとづいて描画を行っていま
す。語が出現するか(1)しないか(0)にもとづく計算で、共起の程度の強弱を
計算しています。
# より正確にはJaccard係数を用いています。2つの語の共起の程度は、どちら
# か片方が出現する時に、もう一方も出現しているかどうかで測っています。
したがってTF・IDF等による重み付けとは無関係な計算であり、重み付けを行
う意味は無いと考えられます。
> 3.確認の質問
はい、お書きいただいたとおりです。
どうぞよろしくお願いいたします。