[掲示板へもどる]
一括表示

  [No.1313] 最小jaccard係数・共起ネットワーク 投稿者:mmm  投稿日:2013/04/03(Wed) 07:22:45

樋口先生
Re: Jaccard係数の読み方(大きさ)について、
0.1 → 関連がある
0.2 → 強い関連がある
0.3 → とても強い関連がある
とありますが、
共起ネットワークで得られた(最小)jaccard係数について記述された論文(英語・(日本語))はございますでしょうか?
なかなか見つけられず、悪戦苦闘中です。ご教示いただけますと有難く存じます。よろしくお願い申し上げます。


  [No.1316] Re: Jaccard係数の読み方(共起ネットワーク) 投稿者:HIGUCHI Koichi  投稿日:2013/04/03(Wed) 15:55:24

こんにちは、樋口です。書き込みありがとうございます。

抜粋していただいたのは、あくまで無理矢理に単純化すると、そんな感じかな
というものですね。こちらもご参照下さい。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=122&mode=allread

上記スレッドからさらにもう少し考えてみますと、おなじ0.1という値であっ
ても、データが全体としてどの程度スパース(粗)かといったことによって、
値の「重み」というか実質的な関連の強さというかが、変わってくるかもしれ
ません。

そのため、上記スレッドに書いたような相対的な読み方(比較)がある程度は
必要になり、一律の基準というのは書きにくいだろうと思います。書いている
文献がありましたら、是非ここでお教えください。

さて、そうした相対的な読み方(比較)という観点からは、「上位のいくつか
に注目する」というのはそれなりに意味のある方策だと思います。(いくぶん
便宜的ではありますが) ですから論文でも、例えば以下のように記述すれば
良いのではないかと思うのですが、いかがでしょうか。

> 45回以上出現していた語79種類に注目すると、その間には3019の共起関係が
> 見られた。そのうちJaccard係数が大きい順に60の共起関係を線(edge)と
> して描画した。この結果、描画した最小のJaccard係数は0.138であった。

※「45回」「79種類」「60」については、オプション画面の左側で。「3019」
「.138」については、結果画面の「N , E , D」などのアルファベット・数値
が出ている箇所にマウスカーソルを置いておくと、ポップアップで表示されま
す。※数値はすべて例です。チュートリアルの「こころ」データで、「K」を
強制抽出の上、デフォルト設定で実行するとたぶんこの値になるかと思います。


  [No.1318] Re: 最小jaccard係数・共起ネットワーク 投稿者:mmm  投稿日:2013/04/03(Wed) 19:23:42

樋口先生、丁寧なご返信をしただきましてありがとうございました。

共起ネットワークについて、
論文を引用するようにとの指摘をされ、
HP上に掲載されている書籍を取り寄せ中なのですが、
原理から応用までが書かれた英語論文を見つけ出せず、こちらも悪戦苦闘中です。
異分野からの挑戦で、
不勉強なところが多々ありますが、
ご教示いただけますと大変有難く存じます。
よろしくお願い申し上げます。

> 樋口先生
> Re: Jaccard係数の読み方(大きさ)について、
> 0.1 → 関連がある
> 0.2 → 強い関連がある
> 0.3 → とても強い関連がある
> とありますが、
> 共起ネットワークで得られた(最小)jaccard係数について記述された論文(英語・(日本語))はございますでしょうか?
> なかなか見つけられず、悪戦苦闘中です。ご教示いただけますと有難く存じます。よろしくお願い申し上げます。


  [No.1319] Re: 共起ネットワークの利用時に引用する文献 投稿者:HIGUCHI Koichi  投稿日:2013/04/03(Wed) 21:08:11

こんにちは、樋口です。書き込みありがとうございます。

共起ネットワークを用いる際には、確かに、この方法についての文献を示して
おいた方が良いでしょう。

内容分析(content analysis)の分野では伝統的に用いられている点[1]と、
ネットワーク分析の指標を利用する点について[2]、示しておくと良いのでは
ないかと思います。

[1] Osgood, C.E. 1959 "The Representational Model and Relevant
Research Methods" I. de S. Pool ed. _Trends in Content Analysis_
Urbana, IL: University of Illinois Press, 33-88.

[2] Danowski, J. A. 1993 "Network Analysis of Message Content" W. D.
Richards Jr. & G. A. Barnett eds. _Progress in Communication Sciences
IV_ Norwood, NJ: Ablex 197-221.

このほか、『コーパスとテキストマイニング』の索引で共起ネットワークまた
は共起グラフを探していただけば、(私が書いたものも含めて)上記よりも
もう少し詳しい日本語の解説があるかと思います。
http://www.amazon.co.jp/dp/4320110331


新しい分野で論文を書くのは大変な仕事ですが、一層のご進展を祈念申し上
げます。

なお論文掲載の折には、書誌情報を「研究事例リスト」に掲載させていただ
けますと幸甚です。(^_^;


  [No.1320] Re: 共起ネットワークの利用時に引用する文献 投稿者:mmm  投稿日:2013/04/03(Wed) 21:56:05

樋口先生
早速のご返答をいただきまして誠に有難く存じます。
論文投稿に向けて、文献を参照して、早急に勉強させていただきます。
私どもの分野での共起ネットワークの採用は、新しい解析手法の提案となるため、論文上で詳しい説明が求められております。
論文掲載の折には、ご連絡をさせていただきたく存じます。
今後とも、よろしくお願い申し上げます。