[掲示板へもどる]
一括表示

  [No.861] 共起ネットワークのレイアウトについて 投稿者:袋井  投稿日:2011/10/28(Fri) 20:51:08

樋口先生 様

はじめまして、袋井と申します。

共起ネットワークのレイアウトについて、2点、教えてください。
よろしくお願いいたします。


(1)
マニュアルのp59には、以下のように記載されています。
「語と語のネットワークを描く際には、Fruchterman & Reingoldの
方法を、
 語と変数・見出しのネットワークを描く際には、Kamada & Kawai

 方法を用いている」

先生が、このように使い分けされている意図について、教えていただけ
たら助かります。

色々とデータを変えて、
Fruchterman & Reingold、Kamada & Kawaiの2つの方法の比較
をしてみましたが、
私の題材では大きな違いは出ませんでしたので、その違いに興味があり
ます。


(2)
ノードのカラー表示機能も提供されており、大変に重宝しています。

中心性・グループ分けの色と、グラフレイアウトとがきれいに整合
していることに、いつも感心しています。

ということは、
中心性・グループ分けの計算処理と、グラフレイアウトの計算処理
とは、共通点があるのでしょうか?

以上2点、教えていただけましたら助かります。
よろしくお願いいたします。


  [No.862] Re: 共起ネットワークのレイアウトについて 投稿者:HIGUCHI Koichi  投稿日:2011/10/28(Fri) 23:39:13

Re: 共起ネットワークのレイアウトについて (画像サイズ: 1260×629 37kB)

こんにちは、樋口です。書き込みありがとうございます。

詳細が気になるくらいにまで使いこんでいただき、またマニュアルを詳細にお
読みいただき、大変光栄に存じます。

> Fruchterman & Reingold、Kamada & Kawai

Fruchterman & Reingoldでは、つながっていないノード間には反発力が働くの
で、直接つながっていないノード間に距離が空きます。Kamada & Kawaiではこ
れがありません。

語と語のネットワークであれば、つながっていないノード間に距離が空いた方
が、内容を読み取りやすいように思います。したがってFruchterman & Reingo
ldを利用することにしました。

しかし語と変数のネットワークでは、全体の構造が単純になりがちです。こう
した場合には、反発力が無い方が、全体の構造の単純さがそのままレイアウト
あらわれる感があります。その例として、添付の画像をご覧下さい。Fruchter
man & Reingoldでは反発力が働いて、つながっていないノード間に距離が空き、
結果として全体の印象が複雑になっているように思います。こうした場合には、
全体の構造を読み取り安いKamada & Kawaiの方が適していると考えました。

> レイアウトとノードカラー

それぞれの計算処理は、別の人が別の論文で提案しているものです。そのため、
果たしてどの程度まで共通している部分があるかは、にわかには何とも言えません。

おそらく、レイアウトとノードカラーの整合性を感じられるということは、計
算処理が意図通りに上手く行ったということでしょう。

例えば、次数中心性が高い(エッジの数が多い)ノードは、中心の近くに配置
しないとレイアウトが崩れるでしょう。したがって、上手くレイアウトがされ
ていれば、いかにも中心付近のノードの次数中心性が高くなるでしょう。

また、上手くレイアウトがなされていれば、「ここを通らないと余所に行けな
い(媒介中心性が高い)」ノードは、それと分かる位置にあるでしょう。カラ
ーを媒介中心性にしたときに、そのノードの色が赤ければ、レイアウトとノー
ドカラーが整合していると感じられるでしょう。

サブグループ検出も同様です。レイアウトが上手く行けば、互いに密につなが
っているグループは固まって配置されているでしょう。そして、サブグラフ検
出(密につながっているグループの検出)も上手く行ったならば、同じ色のノ
ードがある程度は固まって配置されることになるでしょう。

以上、ご参考になる部分がありましたら幸いです。


  [No.863] Re: 共起ネットワークのレイアウトについて 投稿者:袋井  投稿日:2011/10/29(Sat) 09:12:20

樋口先生 様

やはり、深い意図があったのですね。

ご丁寧にご説明をしていただきましたので、よく理解できました。
御礼を申し上げます。

商用のテキストマイニング製品でも、語の関係性を見える化する機能
はありますが、
先生のように、ネットワーク分析の中心性などの指標を用いたものは
ないように思います。

語の出現頻度を、ノードの大きさ、フォントの色・大きさ等に対応させ、
語と語の関係性を、エッジの線種、線幅、線色等に対応させることは、
私のようなズブズブの素人でもわかりますが、
ネットワーク分析の指標を適用して大きな効果を出していることに、
改めて感心いたしました。


先生、もう一点教えてください。

先生のご専門のテキスト計量分野では、ネットワーク分析の指標を適用
した比較分析などの研究がされているということでしょうか?


ネットワーク指標には、
Googleのページランキングアルゴリズムのヒントになったと言われる
ボナチッチ中心性など、他にも色々とあるようです。

掲示板を拝見しますと、
計算したネットワーク指標を外部ファイルへ出力する方法して、
自分の目で見たいという要望もあるようです。

今後の機能拡充を楽しみにしております。


  [No.864] Re: 共起ネットワークのレイアウトについて 投稿者:HIGUCHI Koichi  投稿日:2011/10/29(Sat) 13:54:30

こんにちは、樋口です。書き込みありがとうございます。

過分なお褒めをいただき、大変恐縮です。いまだ至らない部分も多いソフトウ
ェアですが、これからも開発を続けていくつもりですので、今後ともどうぞよ
ろしくお願いいたします。

さて、ネットワーク分析の指標については、厳密に数値を比較するというより
も、ネットワーク(グラフ)を読み取りやすくするために、あるいは分析者の
テキストデータに対する理解を深めるために、参考情報として利用する傾向が
強いように思います。一言で書くと「視覚化のため」ということになろうかと
思います。

この視覚化のために、KH Coderではオーソドックスなネットワーク分析の指標
を用いていますが、より新しい視覚化の方法に関する研究も散見されます。す
ぐに思いつくものとして、製品化されているものではキーグラフがありますし、
その他にも国内では鈴木努先生がご研究を進めていらっしゃいます。テキスト
データを視覚化する方法については、それなりに研究がされていると言えるで
しょう。

キーグラフ
http://www2.kke.co.jp/keygraph/

鈴木努先生
http://www.geocities.jp/snatool/profile.html

以上、ご参考になる部分がありましたら幸いです。


  [No.868] Re: 共起ネットワークのレイアウトについて 投稿者:袋井  投稿日:2011/10/30(Sun) 09:19:32

樋口先生さま

ご丁寧なご回答をありがとうございました。

ご親切に教えていただきました
・キーグラフ http://www2.kke.co.jp/keygraph/
・鈴木努先生 http://www.geocities.jp/snatool/profile.html
は既に知っており、両先生の書籍とツールは私の手元にありますので、
一方で、何も返事を差し上げないのも大変に失礼ですので、
どのような回答をさしあげたらよいか、苦慮しておりました。


両ツールともに一時期、評価利用をしましたが、今では利用しておりません。


(1)大澤先生のキーグラフについて

考案者である大澤先生が筑波大においでの頃に、
先生からキーグラフに関する論文一式を頂いたことがございます。
先生がご提案されたコンソーシアムにも入っておりました。

大澤先生が学会発表をされたのは、阪大においでになった時です。
その最初の学会発表は情報処理学会の研究会だったと思いますが、
私も参加しておりました。

キーワードというと、頻度、重要度、偏りなどの指標で考えることが
多いのですが、
キーグラフのキーワードは違いますので、最初は違和感がありました。

キーグラフのキーワードとは、
文書に出現する語を、土台、柱、屋根の3階層に分けた、屋根に相当する語です。

大澤先生の学会発表の時には、英語論文を用いた実験結果についてご説明をされていましたが、
論文はキーグラフのキーワードが適用しやすい題材だと思います。
論文著者の主張すべき語は、まさに屋根にあたるからです。


私は、共起ネットワークを作成した時は大抵、ネットワーク指標も計算して確認します。

中心性などの計算の都合上、エッジの重みを無視した2値化の隣接行列として計算します。

これら計算結果をノードの属性として組で与えて、クラスタリングなどを行うこともあります。

容易に予想されるように、出現頻度が大きいものが中心性などの指標も大きいのですが、
出現頻度が高くないわりには中心性などの指標が高いという場面に遭遇することがあります。
こういう場合ではわくわくします。そのノードを中心に深堀していきます。

キーグラフのキーワードを、このようなネットワーク分析の指標という観点からみた場合には、
出現頻度が低いが、ボナチッチ中心性が高い、という特性をもっているように思えます。
(私の手元にはキーグラフのツールがあるので、やって検証すればいい話ですが、それが分かったからといってキーグラフを使うこともありません)


思い起こせば、
大澤先生がキーグラフをご提案された当時は、
ベクトル空間モデルに基づく、概念検索、類似文書検索という新技術の幕開けの時代でもありました。

ジャストシステム社が米国クラリテック社を買収して、コンセプトベースを製品化しました。

米国アダプ社で開発されたVextSearchを、コマツソフトが扱っていました。
アダプ社の社長はニューラルネット分野の大物です!
(彼を招いたVextSearvhのパーティが帝国ホテルであり、私も声を掛けて頂きました)

私は会社の業務では野村総研の製品を使用しています。
・テキストマイニング ・・・ TrueTeller
・特許情報検索 ・・・ サイバーパテント
後者の製品にVextSearchが組み込まれており、活用しています。
VextSearchはいいですよ。
ベクトル空間モデルの考え方、エンジンがよいのだと思います。

     
大澤先生がキーグラフの発表をされた研究会で、もう一つ大きな発表がありました。
その後一世を風靡することになるGETAの前身であるDualNaviの発表です。
これに触発を受けて、多くの研究がされました。


樋口先生の返信を拝見して、
懐かしい昔を振り返る、よいきっかけを与えていただきました。
長々とすいませんでした。


(2)鈴木努先生のSimple Network Analysis Toolについて

本掲示板でも度々ご紹介のある本は、座右の書であることは間違いありません。
私も活用させていただいております。

ネットワーク分析の代表的な指標の計算を、日本語メニューで簡単にできるツールを提供する本ツールの意義は大きいと思います。
改めて先生に感謝の意を表します。

実際に使ってみると、色々な要望がでてきます。
私は、そういう観点から別のソフトを使っています。


長々とすいませんでした。
今後ともどうぞよろしくお願いいたします。


  [No.869] お礼 // Re: 共起ネットワークのレイアウトについて 投稿者:HIGUCHI Koichi  投稿日:2011/10/30(Sun) 12:40:22

こんにちは、樋口です。書き込みありがとうございます。

先の書き込みでは、新しい情報を提供できていなかったようで恐縮です。にも
かかわらず、それぞれについての所感であったり、お使いになった経緯などを
丁寧にお教えいただき、まことにありがとうございます。私自身にとっても懐
かしく思われる名前がございました。楽しく拝読・勉強させていただきました
こと、心より感謝申し上げます。

なお現在の次数中心性・媒介中心性に加えて、ボナチッチ中心性による色分け
を追加することを、今後の検討課題にしたいと思います。今の時点では機能追
加をはっきりと確言できず恐縮ですが、手元のデータでテストしながら検討さ
せていただきます。

※余談ですが、「ズブの素人」などとは、ちょっとあまりに謙遜が過ぎる表現
だった感がございますね。

ともあれ、こちらこそ今後ともどうぞよろしくお願いいたします。
(ご返信のご心配はどうぞご無用に)