Re: 「抽出語」×「文脈ベクトル」表を使った共起ネットワーク (袋井) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.969] Re: 「抽出語」×「文脈ベクトル」表を使った共起ネットワーク 投稿者:袋井  投稿日:2012/05/17(Thu) 20:33:01

樋口先生 様;

お世話になります、袋井と申します。

毎々、細かい質問でご迷惑をお掛けしております。


過去にご教示いただきました内容について、再確認させてください。

> # 類似度計算
> library(amap)
> d <- Dist(d,method="correlation")
> d <- as.matrix(d)
> d <- 1 - d;


多次元ベクトルの類似度ですので、私はコサイン類似度を使用することが多いです。

library(amap)
d <- Dist(dat,method="pearson")
d <- as.matrix(d)
d <- 1 - d

値が0〜1の範囲となります。


ご教示いただきました以下の計算についても、相関係数だから、値が0〜1の範囲となると思い込んでおりましたが、
計算結果を確認したところ必ずしもそうなりません。

> # 類似度計算
> library(amap)
> d <- Dist(d,method="correlation")
> d <- as.matrix(d)
> d <- 1 - d;

> d <- Dist(d,method="correlation")
は、1を超える場合もあり、結果として、
> d <- 1 - d;
は、マイナスになる場合がございますが、それでよいのでしょうか?

よろしくお願いします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)