[掲示板へもどる]
一括表示

  [No.1818] 「抽出語」x「文脈ベクトル」を用いたクラスタリングについて 投稿者:Shu  投稿日:2014/09/26(Fri) 09:44:41

樋口先生、
いつもお世話になっております。
この前は、ご丁寧な返信をいただき、誠にありがとうございました。

今回は、『「抽出語」x「文脈ベクトル」』を用いたクラスター分析の方法をご質問させていただきたいと思っております。
マニュアルの本に例として取り上げられている様々な研究(例えば、4.2.2や5.3.1)では、この行列でクラスター分析が行われているように理解しましたが、khcoderでは『「文書」x「抽出後」』で指定されています。

『「抽出語」x「文脈ベクトル」』の行列を利用するためには、Rでの作業になると思いますが、あまりRに詳しくなくて、誠に恐縮ですが、その手順を教えていただけたらと思っております。

初歩的な質問で誠に申し訳ありません。
どうぞよろしくお願いいたします。


  [No.1820] Re: 「抽出語×文脈ベクトル」表を用いたクラスター分析 投稿者:HIGUCHI Koichi  投稿日:2014/09/27(Sat) 10:54:04

こんにちは、樋口です。書き込みありがとうございます。

「抽出語×文脈ベクトル」表を、C:\khcoderフォルダに「vector.csv」という
名前で、保存したとします。

この場合は、Rを起動して、例えば以下のようなコマンドを実行することでク
ラスター分析を行えます。

> file <- "c:\\khcoder\\vect.csv" # ファイル名指定
> d <- read.table(file, header=T,sep=",",row.names=1) # ファイル読み込み
> h <- hclust(dist(d,method="euc") , method="ward.D2") # クラスター分析実行
> plot(h) # プロット

さらに詳しくはRのヘルプ・入門書などをご覧いただくのが良いかと存じます。
本のお薦めはこのあたりです。

入門書 http://amzn.to/1DFDGiQ
少し慣れてきたときのリファレンス http://amzn.to/1vo0Mpz

あるいは、SPSSのようなGUIのある統計ソフトを別途お使いいただくのも一手
でしょう。