[掲示板へもどる]
一括表示

  [No.881] 共起ネットワークでのキーワード表示について 投稿者:ykawa  投稿日:2011/12/07(Wed) 12:19:51

樋口先生、

最近KHコーダを使わせていただいています。
さて、共起ネットワークの表示について質問があります。

前処理をしてからツール→抽出語→抽出語リストで抽出語を確認してから、ツール→抽出語→共起ネットワークで表示しています。

共起ネットワークのオプション設定で
最小/最大出現数による語の取捨選択を最小出現数:2
品詞による語の取捨選択:名詞と未知語を選択
と設定して共起ネットワークを描画させたのですが、
抽出後リストで上記の出現回数に該当するキーワードは名詞が61語、未知語が11語あったのに対し、共起ネットワークでは61語しか表示されていませんでした。

例えば、未知語の中でEL(出現回数3回)というキーワードは表示されているが、LED(出現回数3回)は表示されていないといった具合です。

このように共起ネットワークで表示されるキーワードとされないキーワードがあるのはなぜでしょうか?

お手数をお掛けしますが、ご教授いただけると幸いです。


  [No.882] Re: 共起ネットワークに表示されない語 投稿者:HIGUCHI Koichi  投稿日:2011/12/07(Wed) 14:15:29

Re: 共起ネットワークに表示されない語 (画像サイズ: 865×740 39kB)

こんにちは、樋口です。書き込みありがとうございます。
また、詳細に状況をお知らせいただき、大変助かります。

さて、共起ネットワークでは、他の語とつながっていない孤立した語、すなわ
ちedgeを持たない語は表示されません。これは、語と語のつながり(edge)に
注目しようという考え方によるものです。

したがって描画するedgeの数を増やすと、表示される語も多くなる可能性があ
ります。

なお「調整」ボタンの右の部分にマウスカーソルを置いてしばらく待ちますと、
添付画像のように情報が表示されます。添付画像の場合には69語のうち37語だ
けが表示されていることがわかります。また、極めて弱いものも含めれば2311
のつながりがあった中で、上位60を表示しています。その結果として、Jaccard
計数が.138以上のつながりを表示することになっています。
ここで言う「つながり」=edge(s)、「語」=node(s)です。


  [No.883] Re: 共起ネットワークに表示されない語 投稿者:ykawa  投稿日:2011/12/07(Wed) 16:06:20

樋口先生、

早速のご回答有難うございました。

描画するedgeの数を増やしたところ、例えば先ほどの例ですと確かにLEDも表示されるようになりました。
未知語の中のEL、LEDは共に出現回数が3回ですが、edgeはELの方が多いということですね。

ここで更に疑問が生じたのですが、つながりの強さ、弱さ(edgeの数)とはどのようにカウントされるのでしょうか?
他の抽出語に対してのつながりでしょうか?

以上お手数をお掛けしますがよろしくお願いします。


  [No.884] Re: つながり(共起)の測り方 投稿者:HIGUCHI Koichi  投稿日:2011/12/07(Wed) 16:21:55

こんにちは、樋口です。書き込みありがとうございます。

はい、他の語とのつながり(共起)を見ています。

語Aと語Bのつながりの強さですが、「片方が出てきた時に、もう片方もよく一
緒に出てくる」という場合、つながりが強い≒共起の程度が強いと見なされま
す。この程度の強さをJaccard係数というもので測っています。

そういうつながりを「LED」はあまり持っていなかったと言うことですね。

ただ、出現回数が数回の場合は、こういったつながりの強さをあまり正確に計
算できていない可能性がありますので、ご注意ください。数10回くらいは出現
している語同士だと、まずまず納得できる計算結果になると思います。


  [No.885] Re: 共起ネットワークに表示されない語 投稿者:ykawa  投稿日:2011/12/07(Wed) 17:10:58

樋口先生、

大変分かりやすく説明していただき、有難うございます。
リファレンス・マニュアルの理解が深まりました。

また、出現頻度の回数については、あまり注目されていないキーワードにも注目したいため回数が少ないものも含めることが多いので、注意して分析したいと思います。

取り急ぎお礼まで。