[掲示板へもどる]
一括表示

  [No.3901] 共起ネットワークの線の濃さとグループ化について 投稿者:K.O  投稿日:2018/11/20(Tue) 04:34:20

はじめまして。大川と申します。
記述内容の分析にKH Coderを使わせて頂いております。
共起ネットワークのjaccard係数と線の濃さおよびグループ化
について質問させて頂きます。お時間があります折に
ご教授頂ければ幸いです。以下に具体的に書かせて頂きます。

tutorialの「こころ」で試してみてもそうだったので、「こころ」での
状況を書かせていただきます。共起ネットワークのオプションの設定で、
「強い共起関係ほど濃い線に」と、「係数を表示」にチェックを入れました。
この結果描画された図を見ると、同じjaccard係数でも線の濃さが異なっており
(「先生」と「奥さん」、「父」と「兄」はjaccard係数がともに0.14)、
また、jaccard係数が低い語同士でグループ化されており(「言葉」と「口」)、
係数の大きいものでもグループ化されず、線も薄いものがみられます。
線の濃さとグループ化にjaccard係数以外の影響を及ぼす因子があるのでしょうか。
宜しければ、詳しく教えて頂きたく存じます。

過去ログを拝見したり、下記の著書を拝読したりしたのですが、
申し訳ないのですが疑問が拭えず質問させていただきました。

リスク社会を生きる若者たち
http://amzn.to/2dFlBLz

コーパスとテキストマイニング
http://amzn.to/2dpVczA


稚拙な質問で恐縮では御座いますが、宜しくお願い致します。
失礼します。


  [No.3902] Re: 共起ネットワークの線の濃さとグループ化について 投稿者:HIGUCHI Koichi  投稿日:2018/11/20(Tue) 05:25:26

Re: 共起ネットワークの線の濃さとグループ化について (画像サイズ: 902×755 100kB)

こんにちは、樋口です。書き込みありがとうございます。


線の色については、Jaccard係数だけにもとづいています。

> 同じjaccard係数でも線の濃さが異なっており
> (「先生」と「奥さん」、「父」と「兄」はjaccard係数がともに0.14)

うーん、私の目には「先生」と「奥さん」の線も、「父」と「兄」の線も
おおむね同じ色に見えます。画像を添付しました。

もっとも、解像度が低い(使うピクセルの数が少ない)場合には、線の角度
が違うと、色が違って見えることがありうるかもしれません。アンチエイリ
アスの処理が入るためです。

ご参考「アンチエイリアス」
https://ja.wikipedia.org/wiki/%E3%82%A2%E3%83%B3%E3%83%81%E3%82%A8%E3%82%A4%E3%83%AA%E3%82%A2%E3%82%B9

もしこれが気になる場合は、PDFのようなベクトル形式で保存してから、高解
像度で印刷するかラスタライズするしかないでしょう。


グループ分けについてはJaccard係数だけでなく、周囲の状況が関係してきま
す。Jaccard係数が小さめでも、周囲のつながり方次第では同じグループにな
るでしょう。グループ分けの仕方についてはマニュアルA.5.11節に文献を挙
げていますので、そちらをご参照ください。


  [No.3903] Re: 共起ネットワークの線の濃さとグループ化について 投稿者:K.O  投稿日:2018/11/20(Tue) 06:27:48

樋口先生

非常識な時間帯のメール、大変失礼いたしました。
また、迅速に返信いただき、誠にありがとうございます。

>うーん、私の目には「先生」と「奥さん」の線も、「父」と「兄」の線も
おおむね同じ色に見えます。画像を添付しました。

すいません。私もファイルを添付すべきでした。
遅ればせながら「こころ」のファイルを添付させていただきます。
こちらですと、「先生」「奥さん」と「父」「兄」では線の太さが違うように
見えないでしょうか?

懇切丁寧なご回答、本当にありがとうございます。


  [No.3904] Re: 共起ネットワークの線の濃さとグループ化について 投稿者:K.O  投稿日:2018/11/20(Tue) 06:29:26

Re: 共起ネットワークの線の濃さとグループ化について (画像サイズ: 1366×768 173kB)

度々申し訳ございません。
ファイルを添付しそびれました。

お忙しいところ恐縮ですが、ご確認お願い致します。


  [No.3905] Re: 共起ネットワークの線の濃さとグループ化について 投稿者:HIGUCHI Koichi  投稿日:2018/11/20(Tue) 06:38:45

こんにちは、樋口です。書き込みありがとうございます。

「先生」と「奥さん」の方は、グループが別れていますね。グループごとのま
とまりを見えやすくするために、違うグループの語を結ぶ線は点線になります。
点線になったことで、色が薄く見えているようです。

これを避けたい場合は、グループ化しないタイプのプロットをお使いください。
「サブグラフ検出」と書いてあるところをクリックすれば切り替えられます。


  [No.3906] Re: 共起ネットワークの線の濃さとグループ化について 投稿者:K.O  投稿日:2018/11/20(Tue) 09:12:15

樋口先生

返信ありがとうございます。
点線には、そのような配慮があったのですね。
これまで、点線も線の太さの一つだと解釈しておりました。
点線の避け方までお教えくださり、本当にありがとうございます。


もう一点、質問させていただきたいのですが、
共起ネットワークのグループ化とつながりの可視化を利用したく、
抽出語句を自身で作成し、属性の共起をみる、というような用い方をしても
よろしいでしょうか。
たとえば、性別、年代、結婚歴、こどもの有無、職業の種類といった
複数の属性を個々に調査するのではなく、その属性同士の結びつきをみるために
属性の語句だけを抽出し、共起ネットワーク図を作成する、という用い方です。


  [No.3907] Re: 共起ネットワークの線の濃さとグループ化について 投稿者:HIGUCHI Koichi  投稿日:2018/11/20(Tue) 13:44:30

こんにちは、樋口です。書き込みありがとうございます。

探索のために行って見るのは良いと思います。

ただ、そういった変数ですと、(探索をしたあと最終的には)共分散構造
分析を行うのが定跡かなという気はします。

あと私自身は経験がありませんが、探索の段階ではベイジアンネットワー
クという方法も使えるかもしれません。


  [No.3910] Re: 共起ネットワークの線の濃さとグループ化について 投稿者:K.O  投稿日:2018/11/20(Tue) 16:52:10

樋口先生

返信ありがとうございます。

<そういった変数ですと、(探索をしたあと最終的には)
共分散構造分析を行うのが定跡かなという気はします。
あと私自身は経験がありませんが、探索の段階ではベイジアンネットワー
クという方法も使えるかもしれません。

上記の分析手法について、勉強不足なため出直してまいります。
また、不明な点がありましたら、質問させていただきます。

この度は、お忙しい中タイムリーな返信をくださり、
本当にありがとうございました。