Re: (追伸) 語と外部変数(不定長)の共起ネットワーク (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.943] Re: (追伸) 語と外部変数(不定長)の共起ネットワーク 投稿者:HIGUCHI Koichi  投稿日:2012/04/18(Wed) 00:00:50

こんにちは、樋口です。書き込みありがとうございます。

> 1.論文の共著者がA,B,C(後略)

Snowball Stemmerが1文字のアルファベットをどう扱うのか、ちょっとすぐに
は分かりかねますことが1つと、全角アルファベットをStemmerやLemmatizer投
入するのも良くなさそうです。

よって、茶筌を利用する設定のままお使いいただくのがお勧めです。また、デ
ータ・ファイルに全角アルファベットが入力されている場合、強制抽出の欄に
も全角アルファベットをご使用下さい。

それでも出現数が食い違うようでしたら、再度その旨お知らせいただけました
ら幸いです。

> 2. 共起ネットワーク(語と語)での重み付け

共起ネットワークでは、「共起するかどうか」にもとづいて描画を行っていま
す。語が出現するか(1)しないか(0)にもとづく計算で、共起の程度の強弱を
計算しています。

# より正確にはJaccard係数を用いています。2つの語の共起の程度は、どちら
# か片方が出現する時に、もう一方も出現しているかどうかで測っています。

したがってTF・IDF等による重み付けとは無関係な計算であり、重み付けを行
う意味は無いと考えられます。

> 3.確認の質問

はい、お書きいただいたとおりです。

どうぞよろしくお願いいたします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)