Re: 語と外部変数(不定長)の共起ネットワーク (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.933] Re: 語と外部変数(不定長)の共起ネットワーク 投稿者:HIGUCHI Koichi  投稿日:2012/04/13(Fri) 19:33:32

こんにちは、樋口です。書き込みありがとうございます。

残念ながら、お書きいただいたような分析は、現状のKH Coderでは行えません。
著者は1名の場合もあれば3名の場合もあると思いますが、そうした不定長の変
数に現在はKH Coderが対応していないためです。長期的な目標としては対応し
たいのですが、ちょっといつになるか…、というところです。

ただ、まったく方法がない訳ではなく、KH CoderのRスクリプトを編集してい
ただけば、すなわち直接Rをお使いいただけば、お書きいただいたような分析
も可能です。ちょっと面倒でやる気が起きないかもしれませんが、一応、手順
を以下に書かせていただきます。

0. まず、各著者が書いたかどうかをあらわす1-0の2値変数のファイルを作り
ます。1行目が著者名、2行目からがデータで、1行1行が論文をあらわします。
そして、その論文の著者であれば「1」、そうでなければ「0」を入れます。

よって、著者の数と同じ列数になり、行数は論文の数 + 1のファイルになりま
す。「+ 1」は著者名をあらわす最初の行です。

これをCSV形式で保存したファイルを「著者名CSVファイル」とします。ここで
は仮に、Cドライブ直下の「khcoder」フォルダに、「hoge.csv」という名前で
保存したことにします。

1. 次に外部変数として、KH Coderに何か変数を読み込みます。ランダムに
「1」「2」「3」を入力したようなデータでかまいません。内容はなんでも
結構です。

2. その外部変数を使って、「語―外部変数・見出し」の共起ネットワークを
作成します。

3. 共起ネットワークを「R Source」形式で保存します。

4. 保存したファイルをテキストエディタで開き、以下の編集を加えます。

「# END: DATA」という行までが、分析用データの準備をしている部分です。
この行の直前付近を編集することで、上記の「著者名CSVファイル」を読み
込みます。

「d <- cbind(d, v1)」という行を検索し、この行の直前に以下の行を追加し
ます。※行頭の「>」は追加せず、その後だけを追加して下さい。また、直前
でなんどか改行して、追加用のスペースを作って下さい。

> v1 <- NULL
> v1 <- read.csv( file="c:\\khcoder\\hoge.csv" )
> colnames(v1) <- paste('<>',colnames(v1),sep="")

5. 編集したファイルを、KH Coderに付属のRで実行します。これでR上に目的
の分析結果が表示されます。なお「KH Coderに付属のRで実行」の手順につい
ては、以下のスライドの5枚目までがご参考になるかと思います。
http://www.slideshare.net/khcoder/r1kh-coder

共起関係(edge)の描画数を変更したい場合などは、「# END: DATA」の直後
を編集して下さい。

> edges <- 60

のようになっている部分です。「60」を「120」に変更すれば、描画数が120に
なります。Jaccard係数の値でしている場合は「th」の値を変更します。また
「use_freq_as_size」を「0」にするか「1」にするかで、「出現数の大きい語
ほど大きい円で」オプションを切り替えられます。

6. 結果(プロット)上で、右クリックして、結果を保存・コピーして下さい。


手順は以上です。もしやってみられて、分からないことやエラーなどありまし
たら、随時お知らせ下さい。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)