[掲示板へもどる]
一括表示

  [No.1510] 主成分分析について 投稿者:fujimoto  投稿日:2013/11/11(Mon) 13:36:08

こんにちは、樋口先生のKH Coderにはお世話になっております。

今回、下記のようなことが可能かどうかお聞きしたいと思います。

複数のファイルの語句を主成分分析とクラスター分析を行いたいのですが、
その時、各語句の主成分分析・クラスター分析ではなく、各ファイル名で結果を表示することはできますか?


お忙しいところ恐縮ですが、よろしくお願いします。


  [No.1511] Re: 主成分分析について 投稿者:HIGUCHI Koichi  投稿日:2013/11/11(Mon) 23:26:03

こんにちは、樋口です。書き込みありがとうございます。
以下のような手順で可能です。

複数のファイルを、こちらの手順で1つのファイルに併合します。
http://khc.sourceforge.net/kuroshio.html#c5prac

そうしますとファイルA・ファイルB・ファイルCのように別々のファイルだっ
たものが、1つのファイル内で文書A・文書B・文書Cというふうに認識されます。

あとはメニューから「ツール」「文書」「クラスター分析」と進めてください。
集計単位として「H2」を選択すると良いでしょう。分析結果が出たら、画面右
側の「プロット」ボタンをクリックすることで、デンドログラムが表示されま
す。


次に主成分分析ですが、KH Coder上のマウス操作だけでは実行できません。

対応分析でも良ければ、次の手順で実行できます(対応分析でも多くの場合
は似た結果になります)。「ツール」「抽出語」「対応分析」と進めて、「抽
出語×文書」「H2」を選択して「OK」をクリックします。結果が出たら、左下
の部分で「変数のみ」を選択します。すると、文書名だけがプロットされて、
抽出語は薄い色のドットのみとなります。このページの少し下の方に例があ
ります:
http://khc.sourceforge.net/screen/c10corresp_full.png
http://khc.sourceforge.net/kuroshio.html#c10


対応分析ではなく、主成分分析にこだわりたい場合は、上記デンドログラムを
「R Source」形式で保存し、R上で実行します。このスライドの5枚目までの手
順です。
http://www.slideshare.net/khcoder/r1kh-coder

その後に主成分分析のRコマンドを実行すれば、主成分分析を行うことができ
るでしょう。


  [No.1512] Re: 主成分分析について 投稿者:fujimoto  投稿日:2013/11/13(Wed) 13:01:32

こんにちは、樋口先生。
返信ありがとうございました。
対応分析をしてみたのですが、

最新版で対応分析をしてみたところ、結果の左下の部分で「ドットのみ」、「ドットとラベル」はあるのですが、「変数のみ」というものがないのですが、どうすればいいのでしょうか?


  [No.1513] Re: 主成分分析について 投稿者:HIGUCHI Koichi  投稿日:2013/11/13(Wed) 13:15:53

こんにちは、樋口です。書き込みありがとうございます。

対応分析で、もともと抽出語しかプロットされていない場合は、「変数のみ」
が表示されません。

上記No. 1511の手順をとられた場合は、対応分析の実行時に、「抽出語×文書
」「H2」を選択していて、なおかつ「見出しまたは文書番号を同時布置」にチ
ェックが入っていることをご確認ください。

もし「H2」を選択できない状態でしたら、複数ファイルの結合の仕方が、何か
上手くいっていないものと思います。こちらの手順通りに結合していただいて、
前処理を再度実行されると良いかもしれません。
http://khc.sourceforge.net/kuroshio.html#c5prac


  [No.1514] Re: 主成分分析について 投稿者:fujimoto  投稿日:2013/11/14(Thu) 10:36:49

こんにちは。

書かれている通りにしてみましたが、「見出しまたは文書番号を同時布置」にチェックを入れて実行してみましたが、5時間ほどしても実行が終わらない(応答なしになる)もしくは、知らない間に強制終了されているとなります。
行数が1000行くらいで、そのうち抽出する語句が200語位なのですが、時間がかかるのかエラーもしくは処理が上手くいっていないのかわからない状態なのです。


  [No.1515] Re: 主成分分析について 投稿者:HIGUCHI Koichi  投稿日:2013/11/14(Thu) 12:40:58

こんにちは、樋口です。書き込みありがとうございます。

KH Coderを起動して当該のプロジェクトを開いた際、「文書の単純集計」部分
の「H2」の数値はいくつになっていますでしょうか?

この部分の数値は、結合したファイルの数と一致するはずです。

この数値がある程度よりも大きい場合、現状のKH Coderではお書きのような事
象が発生するかもしれません。


  [No.1516] Re: 主成分分析について 投稿者:fujimoto  投稿日:2013/11/14(Thu) 13:12:28

こんにちは。

> KH Coderを起動して当該のプロジェクトを開いた際、「文書の単純集計」部分
> の「H2」の数値はいくつになっていますでしょうか?

「H2」の数値は33個です。


  [No.1517] Re: 主成分分析について 投稿者:HIGUCHI Koichi  投稿日:2013/11/14(Thu) 13:19:32

こんにちは、樋口です。書き込みありがとうございます。

対応分析のオプション画面において、「集計単位:」の箇所で「H2」
を選択していることを、念のためにもう一度確認してから、「OK」を
クリックしてお試しいただけますでしょうか。

3分待っていただいて結果が出なければ、それ以上待っていただいて
もおそらく駄目ですので、強制終了してください。