Re: 共起ネットワーク<語ー外部変数・見出し>のJaccard係数 (SAITOH) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.3516] Re: 共起ネットワーク<語ー外部変数・見出し>のJaccard係数 投稿者:SAITOH  投稿日:2018/03/05(Mon) 20:57:12

早速、ご丁寧な回答をいただきありがとうございます。

> あんなに多くの方にご参加いただいた

予想はしていたものの、私自身も会場の熱気に圧倒され、また同時にKH Coderの関心の高さを肌で感じました。これほど社会のニーズをとらえたソフトを、世に生み出された先生の御功績に同じ研究者として敬服いたします。

さて、以下について改めてご教示いただきたく質問させていただきます。

> 今後としては、描画する共起関係を選ぶためにはこれまでと同じように調整し
> た係数を使いつつ、「係数を表示」「強い共起関係ほど濃い線に」オプション
> 利用時にはもとの純粋な係数を用いることを考えています。

つまり、改善後に表示される係数はJaccard係数になるだけであり、edgeおよび共起語の状況は今のKH Coderのバージョンで描かれる結果と同じと理解します。
したがって、手計算(上でご教示いただいた計算式)により各edgeのJaccard係数を計算すれば、この係数はそれぞれの見出しで標準化された値ではないため、<前半>と<後半>のJaccard係数について大小比較できると理解してよろしいでしょうか?例えば、<前半>と語A、<後半>と語AのそれぞれのJaccard係数において、前者の方が大きければ語Aは<前半>に比較的多く表れていたと言ってよいのでしょうか?

また、「描画するedgeの選択」で現状はJaccard係数≧0.3と条件づけて出力しているわけですが、この条件値も標準化された数値と解釈します。この場合、例えば論文化する際はどのように記述することが適当と言えるでしょうか?

最後に標準化についてですが、この全体像をここでお教えいただくのは無理があるのだろうと想像しますが、可能ならばヒントだけでもご教示いただけないでしょうか(他者へ説明するために)。例えば、それぞれの見出しの抽出語数や段落数を標準化に用いているのか、或いは数学の〇〇法を用いているのか、などをご教示いただければ幸いです。
よろしくお願いいたします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)