[掲示板へもどる]
一括表示

  [No.1837] クラスター分析の表について 投稿者:岡本  投稿日:2014/10/09(Thu) 10:18:18

おはようございます。
何度も質問失礼します。
頻出150語のクラスター分析を行ったのですが、図に表記はできました。
しかし、p.70の表に表したいと思っているのですが、こちらはどのようにしたらできるのでしょうか?
自分で調べた際、KHCoderのHPでは表にできるとありましたが、いくら調べてもわかりませんでした。
また、Rも使用したのですが、こちらも図には表記できたのですが、表にはできませんでした。

p.70のクラスター分析の表は頻出語150ではなく、文書のほうのクラスター分析なのでしょうか。
知識がなくすいません。

お忙しいと思いますが、何卒よろしくお願いします。


  [No.1840] Re: クラスター分析の表について 投稿者:HIGUCHI Koichi  投稿日:2014/10/09(Thu) 19:14:48

こんにちは、樋口です。書き込みありがとうございます。

「KH Coderの本」第5章、表5.2ですね。これは抽出語のクラスター分析ですが、
この表を自動作成する機能は現在のKH Coderにはありません。

お手数ですがこの表は、結果の図(デンドログラム)等を見ながら、手で打ち
込んで作成してください。


あるいは、「クラスターの色分け」にチェックを入れた状態でクラスター分析
を行い、結果を*.rファイルとして保存します。そしてRを起動してこのファイ
ルを実行した後、以下のコマンドを実行します。

> write.csv(bard,file='c:/khcoder/cluster.csv')

保存されたcluster.csvからコピー&ペーストすると表を作成しやすいでしょう。
抽出語、出現回数、クラスター番号の順に列が並んでいます。


  [No.1845] Re: クラスター分析の表について 投稿者:岡本  投稿日:2014/10/15(Wed) 16:23:07

こんにちは。
返信ありがとうございます。

あるいは、「クラスターの色分け」にチェックを入れた状態でクラスター分析
を行い、結果を*.rファイルとして保存します。そしてRを起動してこのファイ
ルを実行した後、以下のコマンドを実行します。

write.csv(bard,file='c:/khcoder/cluster.csv')

とあったのですが、rファイルで保存をしたのですが、Rstudioで表示され、読み込むことができません。
The file 'txt.r' is too large to open in source editor ( the file is 2.1 MB and the maximum file size is 2 MB)
と表示されます。

Rでこのクラスターの色分けにチェックを入れた状態でクラスター分析を行い、Rを起動してこのファイルの実行を行うにはどうすればいいのでしょうか?


KHCoder以外の質問となりますが、申し訳ございません。


  [No.1847] Re: クラスター分析の表について 投稿者:HIGUCHI Koichi  投稿日:2014/10/15(Wed) 19:07:07

こんにちは、樋口です。書き込みありがとうございます。

*.rファイルの保存まではできているのですね。

保存した*.rファイルをRで実行するというのは、こちらのスライドの4枚目5枚
目のような手順です。
http://www.slideshare.net/khcoder/r1kh-coder


  [No.1848] Re: クラスター分析の表について 投稿者:岡本  投稿日:2014/10/15(Wed) 23:42:20

返信ありがとうございます。

読み込むことはできたのですが
エラーばかりでやはりcsvデータにすることができませんでした。
なので、自分で打とうと思います。
その際に出現回数はみるとこはできないでしょうか


  [No.1849] Re: クラスター分析の表について 投稿者:HIGUCHI Koichi  投稿日:2014/10/19(Sun) 12:36:32

こんにちは、樋口です。書き込みありがとうございます。

スライドの4ページ目で示しているように、KH Coderに添付のRをお使いいただ
けば、おそらく、エラーにはならないのではないかと思います。もし、それで
もエラーになる場合は、具体的なエラーメッセージをお知らせいただければ、
原因や解決策を探ることができようかと思います。

もちろん、Rに固執せずに、手で入力していただくことも可能です。その場合
には、「抽出語検索」「抽出語リスト」機能を使って、出現回数を確認してく
ださい。


  [No.1853] Re: クラスター分析の表について 投稿者:岡本  投稿日:2014/10/23(Thu) 01:08:20

お返事ありがとうございました。
頻出語のクラスター分析の表は作ることができました。

しかし、頻出語ではクラスター数をこちらで決めることができず、「文書×抽出語」表のコマンドによって出力されたものを使用しようと考えています。

そこでお聞きしたいことがふたつあります。
一つ目はこちらで、Rに読み込みクラスター分析のプロットを出力することまではできました。しかし、量が多くそこから、クラスターの数やクラスター内の語を見ることができないため、こちらをcsvに置き換えることは可能でしょうか。

二つ目は頻出語のクラスター分析についてはわかったのですが、「文書×頻出語」のクラスター分析について違いがわかりません。
KHCoder内でできる「ツール」→「文書」→「クラスター分析」で出力される結果はどういったものなのですか。
各クラスター内の特徴語を見たのですが、どういった意味なのかが全くわからず、重みのつけ方もあっているのか、わかりませんでした。

何度もすいません。


  [No.1854] Re: クラスター分析の表について 投稿者:HIGUCHI Koichi  投稿日:2014/10/23(Thu) 01:56:20

こんにちは、樋口です。書き込みありがとうございます。

> 頻出語ではクラスター数をこちらで決めることができず

「抽出語」のクラスター分析のことでしょうか? そうであれば、オプション
画面の「クラスター数」というところに数字を入れることで、クラスター数を
手動で設定できます

> 一つ目はこちらで、Rに読み込みクラスター分析のプロットを出力すること
> まではできました。しかし、量が多くそこから、クラスターの数やクラス
> ター内の語を見ることができないため、こちらをcsvに置き換えることは可
> 能でしょうか。

Rの入門書を見て、Rのコマンドを書いてみれば、おそらく可能かと思います。
ただ、まぁ、上述のKH Coderでのクラスター数指定を行っていただく方が楽で
しょう。

ちなみにRの入門書としては、こちらがお薦めです。
http://amzn.to/1DFDGiQ

> KHCoder内でできる「ツール」→「文書」→「クラスター分析」で出力され
> る結果はどういったものなのですか。

「ツール」→「文書」→「クラスター分析」で出力されるのは、抽出語をグル
ープ分けするのではなく、文書をグループ分けした結果です。