[掲示板へもどる]
一括表示

  [No.2864] 共起ネットワークの安定性について 投稿者:   投稿日:2017/01/13(Fri) 17:25:43

樋口さま、

いつもありがとうございます。
一般的な質問で恐縮ですが、
共起ネットワークを2万語程度のテキスト解析を外部変数20個程度とともに行い作成しておりますが、
やっておりますが、共起ネットの結果が、KHcoderを使うPCや日にちを置くと、ネットワークの形や外部変数の位置が
微妙に異なるかと思いますが、再現性はPCの環境によっても日々異なるのでしょうか。
あるいは、大凡のことでネットワークの形がずれるということはなく、
やはりデータ側の問題でしょうか。論文に投稿する際、注意書き等で
何か書いた方がいいべきことあれば、御教授下さい。
宜しく御願い致します。


  [No.2865] Re: 共起ネットワークの安定性について 投稿者:HIGUCHI Koichi  投稿日:2017/01/13(Fri) 19:05:28

こんにちは、樋口です。書き込みありがとうございます。

原則として同じデータで同じ設定であれば、同じ結果になるはずです。ただし、
Windowsのバージョンが32bitの場合と64bitの場合では、異なる配置になります。


なお共起ネットワークでは、語の配置にはあまり意味がなく、線でつながって
いるかどうかが重要です。2つの語が近くにあっても、それらの語が線でつな
がっていなければ、共起の程度が強いわけではありません。

語の配置については、ネットワークが見やすいようにという基準で決めていま
す。たとえば語を結ぶ線と線が、なるべく交わったり重なったりしない方が見
やすいネットワークになります。この配置を決める際に乱数を利用しているた
め、32bit版のOSと64bit版のOSとでは、異なる語の配置となります。またKH
Coderのバージョンによっても、異なる配置になる場合があるでしょう。ただ
し語の配置は変化しても、どの語とどの語が線で結ばれているかということや、
サブグラフ検出の結果などは変化しません。

こうした事情もありますので、語の配置ではなく、どの語とどの語がつながっ
ているかを見るようになさって下さい。


  [No.2866] Re: 共起ネットワークの安定性について 投稿者:としゆき  投稿日:2017/01/15(Sun) 08:15:19

樋口様、

ありがとうございます。了解いたしました。
あと、共起ネットワークで分析を行って行く上で、ネットワークdensityかノードの数を合わせて、経年で変化をとるといったことをしたいのですが、やはり描画数やjaccard係数で調節していくしかないでしょうか?

要は、特に論文上は、同じ密度(条件)の中で、共起度を見ないと重要語の相対的な重要度をはかれないかと思っております。

土屋

> こんにちは、樋口です。書き込みありがとうございます。
>
> 原則として同じデータで同じ設定であれば、同じ結果になるはずです。ただし、
> Windowsのバージョンが32bitの場合と64bitの場合では、異なる配置になります。
>
>
> なお共起ネットワークでは、語の配置にはあまり意味がなく、線でつながって
> いるかどうかが重要です。2つの語が近くにあっても、それらの語が線でつな
> がっていなければ、共起の程度が強いわけではありません。
>
> 語の配置については、ネットワークが見やすいようにという基準で決めていま
> す。たとえば語を結ぶ線と線が、なるべく交わったり重なったりしない方が見
> やすいネットワークになります。この配置を決める際に乱数を利用しているた
> め、32bit版のOSと64bit版のOSとでは、異なる語の配置となります。またKH
> Coderのバージョンによっても、異なる配置になる場合があるでしょう。ただ
> し語の配置は変化しても、どの語とどの語が線で結ばれているかということや、
> サブグラフ検出の結果などは変化しません。
>
> こうした事情もありますので、語の配置ではなく、どの語とどの語がつながっ
> ているかを見るようになさって下さい。


  [No.2867] Re: 共起ネットワークの安定性について 投稿者:HIGUCHI Koichi  投稿日:2017/01/15(Sun) 17:36:07

こんにちは、樋口です。書き込みありがとうございます。

そうですね、そうした用途でしたら描画数やjaccard係数で調節するか、ある
いはR Source形式で保存してRコマンドを直接編集していただくのが確実かも
しれません。KH Coderでは単に強い共起関係を描画するという仕組みになって
いますが、Densityやノード数を考慮した仕組みを追加していただくのが一手
と思います。

※KH Coderの共起ネットワークでは、共起関係を可視化することを主要な目的
としています。少なくともこれまでのところ、語の相対的な重要度を、複数の
ネットワークで厳密に比較するという発想はありませんでした。


  [No.2869] Re: 共起ネットワークの安定性について 投稿者:としゆき  投稿日:2017/01/16(Mon) 23:21:34

樋口様、

ありがとうございます。あともう一点、中心性についてですが、
外部変数を入れて共起ネットを作った場合、水色、白、ピンクが
出てこないでいのですが、これは、緑、薄緑、オレンジの順に、中心性が
低くなるという理解でよろしいでしょうか?



> こんにちは、樋口です。書き込みありがとうございます。
>
> そうですね、そうした用途でしたら描画数やjaccard係数で調節するか、ある
> いはR Source形式で保存してRコマンドを直接編集していただくのが確実かも
> しれません。KH Coderでは単に強い共起関係を描画するという仕組みになって
> いますが、Densityやノード数を考慮した仕組みを追加していただくのが一手
> と思います。
>
> ※KH Coderの共起ネットワークでは、共起関係を可視化することを主要な目的
> としています。少なくともこれまでのところ、語の相対的な重要度を、複数の
> ネットワークで厳密に比較するという発想はありませんでした。


  [No.2870] Re: 共起ネットワーク(語―外部変数・見出し)のカラーについて 投稿者:HIGUCHI Koichi  投稿日:2017/01/17(Tue) 18:08:01

こんにちは、樋口です。書き込みありがとうございます。

共起ネットワーク作成時に、共起関係(edge)の種類として「語―外部変数・
見出し」を選択した場合、カラー表示は1種類のみとなります。このカラー表
示では、変数・見出しの色は固定で、語の色はedgeの数だけをもとに決めてい
ます。たくさんの変数や見出しとつながるほど青っぽくなっていきます。
(したがって中心性を計算しているわけではありません)


  [No.2874] Re: 共起ネットワーク(語―語、外部変数・見出し)のネットワークDについて 投稿者:としゆき  投稿日:2017/01/18(Wed) 23:26:35

樋口様、

ありがとうございます。共起ネットワーク機能についてもう一つ質問させてください。
最小出現数や最小文章数、描画数などをすべて一致させても、語と語の場合の共起ネットと
外部変数・見出し・の場合の共起ネットでは、N、E、Dの値がすべて変わってしまいます。
これは、外部変数ー見出しの場合と語と語の共起ネットの作り方で、
何が異なってしまうのでしょうか。





> こんにちは、樋口です。書き込みありがとうございます。
>
> 共起ネットワーク作成時に、共起関係(edge)の種類として「語―外部変数・
> 見出し」を選択した場合、カラー表示は1種類のみとなります。このカラー表
> 示では、変数・見出しの色は固定で、語の色はedgeの数だけをもとに決めてい
> ます。たくさんの変数や見出しとつながるほど青っぽくなっていきます。
> (したがって中心性を計算しているわけではありません)


  [No.2876] Re: 共起ネットワーク(語―語、外部変数・見出し)のネットワークDについて 投稿者:HIGUCHI Koichi  投稿日:2017/01/23(Mon) 14:37:05

こんにちは、樋口です。書き込みありがとうございます。

> 外部変数ー見出しの場合と語と語の共起ネットの作り方で、
> 何が異なってしまうのでしょうか。

見比べてみると、何が異なっているように見えますか?