[掲示板へもどる]
一括表示

  [No.2451] 語の共起ネットワークのRコード 投稿者:ナナッチ  投稿日:2016/04/23(Sat) 14:59:26

樋口先生、
ナナッチと申します、ご教示をいただければ大変に助かります。

語の共起ネットワークのRコードについて、ご確認させてください。


Rプログラムのとても良いお手本になると思い、
語の共起ネットワークで保存したRコードを見ています。


# 類似度計算
d <- dist(d,method="binary")
d <- as.matrix(d)
d <- 1 - d;


もし、dオブジェクトに相当する行列を外部ファイルから読み込めば、
以降のプログラムは再利用できるのでしょうか?


質問の意図は、
ジャッカード係数以外の類似度計算(相互情報量、情報エントロピーなど)の
計算結果ファイルを読み込んで、
KHcoderの共起ネットワークを作図できればとても助かります。



上記が可能として、もう一つ、ご質問がございます。

閾値 th を0にして、エッジ数 edges で指定する場合であっても、
dオブジェクトは、0〜1の範囲内である必要はあるのでしょうか?

任意の正の実数でも良いのでしょうか?


以上、よろしくお願いいたします。


  [No.2454] Re: 語の共起ネットワークのRコード 投稿者:HIGUCHI Koichi  投稿日:2016/04/23(Sat) 21:41:06

こんにちは、樋口です。書き込みありがとうございます。

> もし、dオブジェクトに相当する行列を外部ファイルから読み込めば、
> 以降のプログラムは再利用できるのでしょうか?

はい、そのはずです。

(英語ですが)こちらに異なる係数を使う例があります。Jaccardではなく
Ochiaiを使う例です。外部ファイルからの読み込みを行なわなくても、コマン
ドを数行書き換えれば、異なる係数を利用できます。
https://sourceforge.net/p/khc/discussion/222396/thread/a2d8a1b9/?limit=25#098a


> dオブジェクトは、0〜1の範囲内である必要はあるのでしょうか?

たぶん、0-1までの範囲におさまらなくても大丈夫だと思うのですが、100%の
確信は持てません。試してみて、もし問題が出たらまた書き込んで下さい。


  [No.2459] Re: 語の共起ネットワークのRコード 投稿者:ナナッチ  投稿日:2016/04/24(Sun) 19:12:44

樋口先生、
ナナッチと申します、ご教示をいただき、大変に感謝しております。

検討を進めていて、3点、お聞きしたいことがでてまいりました。
ご教示をいただければ、大変に助かります。


(1)
KHcoderの「語の共起ネットワーク」から保存したrファイルを、
KHcoder梱包のRguiに読み込みました。

ネットワーク図は再現されましたが、コンソールには、以下のメッセージが出力されています。

実害はないという理解でよろしいでしょうか?


> C:\\khcoder-200ef\\test.r")

要求されたパッケージ Rcpp をロード中です
Non-function objects are not currently inserted (not traceable): .packageName
Modified functions inserted through trace(): wordlayout
[1] "iterations: ・・・"



(2)
KHcoderの「語の共起ネットワーク」では、画像サイズを指定することができて、大変に重宝しています。

KHcoder梱包のRguiで、語の共起ネットワークのrプログラムを実行した場合にも、
同じように、画像サイズを指定して保存できれば、大変に助かります。

お手数ですが、
描画されたネットワーク図を、指定のサイズで、ファイル名を与えて、保存する
Rプログラムの例示を、お示ししていただけると助かります。

どうぞ、よろしくお願いします。



(3)
類似度、距離には、色々な種類があることが分かりました。

エッジの重みは、正の実数でなければなりません。

相関係数は、-1から1までの範囲をとりますので、
もし、相関係数を用いて、エッジの重みとする場合には、
何かしらの変換が必要となります。

ズブの素人考えですが、
相関係数に1を加えて、0から2までの範囲とする、
として、よろしいのでしょうか?


以上、ご教示をよろしくお願いいたします。

ナナッチ


  [No.2461] Re: 語の共起ネットワークのRコード 投稿者:HIGUCHI Koichi  投稿日:2016/04/24(Sun) 23:10:35

こんにちは、樋口です。書き込みありがとうございます。

> (1)
> 実害はないという理解でよろしいでしょうか?

はい、結構です。詳細はRのマニュアルや参考書をご参照下さい。

> (2)
> 画像サイズを指定して保存

だいたいこんな感じでしょうか。

#----------------------------------------------------------------------
library( Cairo )
Cairo(
    width=800, height=600, dpi=72, unit="px",
    file="c:/khcoder/save.png",
    type="png", bg="white"
)
par(family="Meiryo UI")
par(mai=c(0,0,0,0), mar=c(4,4,1,1), omi=c(0,0,0,0), oma =c(0,0,0,0) )

# ここで描画を行なうコマンドを実行

dev.off()
#----------------------------------------------------------------------

help(Cairo)でより詳しい情報を得られます。

> (3) 相関係数

相関係数は0を境にして、プラスとマイナスで意味が変わりますので、0-2の連
続数として扱って良いかどうか、ちょっと悩ましいですね。この分野でよく使
われているコサイン係数ですと、相関係数にかなり近い振る舞いで、なおかつ
もともと0-1で良いかもしれません。


  [No.2462] Re: 語の共起ネットワークのRコード 投稿者:ナナッチ  投稿日:2016/04/25(Mon) 21:36:00

樋口先生、
ナナッチと申します、ご教示をいただき、大変に感謝しております。

助かりました!!