Re: 共起ネットワークとjaccard係数について (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.2071] Re: 共起ネットワークとjaccard係数について 投稿者:HIGUCHI Koichi  投稿日:2015/05/25(Mon) 10:31:31

こんにちは、樋口です。書き込みありがとうございます。

> 関連語検索でJaccard係数を用いて共起ネットワークを作成した場合、
> 「これは、Jaccard係数をもとに作成した共起ネットワークです」と
> 言えるでしょうか?

言えると私は考えています。全体ではなくて、一部のデータを使って、
Jaccard係数を算出したと言えようかと思います。

関連語検索で「とある語」を検索したような場合は、「とある語」を含むデー
タだけをもとに算出したネットワーク、すなわち「とある語」の周囲の関連を
(Jaccard係数で計算して)描いたネットワークとなるでしょう。

> 例えば、「0.2以上」と設定した場合、その理由をどのように述べればよい
> でしょうか?

「データ中に見られる相対的に強い関連を描くため、○○の値を設定した」
というような書き方ではいかがでしょう。厳密に書こうとすると、関連の強さ
(Jaccard係数)の分布を示すことになるでしょうか。「このデータ中では、
Jaccard係数の平均は○○で、分散は△△なので、□□以上であれば相対的に
大きな値(強い関連)と見なせるだろう」といった形になりますでしょうか。


※「RMSEAが○○未満でなくてはならない」とかそういった固定基準がない分、
丁寧にデータを見る必要があると言えるかもしれません。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)