こんにちは、樋口先生のKH Coderにはお世話になっております。今回、下記のようなことが可能かどうかお聞きしたいと思います。複数のファイルの語句を主成分分析とクラスター分析を行いたいのですが、その時、各語句の主成分分析・クラスター分析ではなく、各ファイル名で結果を表示することはできますか?お忙しいところ恐縮ですが、よろしくお願いします。
こんにちは、樋口です。書き込みありがとうございます。以下のような手順で可能です。複数のファイルを、こちらの手順で1つのファイルに併合します。http://khc.sourceforge.net/kuroshio.html#c5pracそうしますとファイルA・ファイルB・ファイルCのように別々のファイルだったものが、1つのファイル内で文書A・文書B・文書Cというふうに認識されます。あとはメニューから「ツール」「文書」「クラスター分析」と進めてください。集計単位として「H2」を選択すると良いでしょう。分析結果が出たら、画面右側の「プロット」ボタンをクリックすることで、デンドログラムが表示されます。次に主成分分析ですが、KH Coder上のマウス操作だけでは実行できません。対応分析でも良ければ、次の手順で実行できます(対応分析でも多くの場合は似た結果になります)。「ツール」「抽出語」「対応分析」と進めて、「抽出語×文書」「H2」を選択して「OK」をクリックします。結果が出たら、左下の部分で「変数のみ」を選択します。すると、文書名だけがプロットされて、抽出語は薄い色のドットのみとなります。このページの少し下の方に例があります:http://khc.sourceforge.net/screen/c10corresp_full.pnghttp://khc.sourceforge.net/kuroshio.html#c10対応分析ではなく、主成分分析にこだわりたい場合は、上記デンドログラムを「R Source」形式で保存し、R上で実行します。このスライドの5枚目までの手順です。http://www.slideshare.net/khcoder/r1kh-coderその後に主成分分析のRコマンドを実行すれば、主成分分析を行うことができるでしょう。
こんにちは、樋口先生。返信ありがとうございました。対応分析をしてみたのですが、最新版で対応分析をしてみたところ、結果の左下の部分で「ドットのみ」、「ドットとラベル」はあるのですが、「変数のみ」というものがないのですが、どうすればいいのでしょうか?
こんにちは、樋口です。書き込みありがとうございます。対応分析で、もともと抽出語しかプロットされていない場合は、「変数のみ」が表示されません。上記No. 1511の手順をとられた場合は、対応分析の実行時に、「抽出語×文書」「H2」を選択していて、なおかつ「見出しまたは文書番号を同時布置」にチェックが入っていることをご確認ください。もし「H2」を選択できない状態でしたら、複数ファイルの結合の仕方が、何か上手くいっていないものと思います。こちらの手順通りに結合していただいて、前処理を再度実行されると良いかもしれません。http://khc.sourceforge.net/kuroshio.html#c5prac
こんにちは。書かれている通りにしてみましたが、「見出しまたは文書番号を同時布置」にチェックを入れて実行してみましたが、5時間ほどしても実行が終わらない(応答なしになる)もしくは、知らない間に強制終了されているとなります。行数が1000行くらいで、そのうち抽出する語句が200語位なのですが、時間がかかるのかエラーもしくは処理が上手くいっていないのかわからない状態なのです。
こんにちは、樋口です。書き込みありがとうございます。KH Coderを起動して当該のプロジェクトを開いた際、「文書の単純集計」部分の「H2」の数値はいくつになっていますでしょうか?この部分の数値は、結合したファイルの数と一致するはずです。この数値がある程度よりも大きい場合、現状のKH Coderではお書きのような事象が発生するかもしれません。
こんにちは。> KH Coderを起動して当該のプロジェクトを開いた際、「文書の単純集計」部分> の「H2」の数値はいくつになっていますでしょうか?「H2」の数値は33個です。
こんにちは、樋口です。書き込みありがとうございます。対応分析のオプション画面において、「集計単位:」の箇所で「H2」を選択していることを、念のためにもう一度確認してから、「OK」をクリックしてお試しいただけますでしょうか。3分待っていただいて結果が出なければ、それ以上待っていただいてもおそらく駄目ですので、強制終了してください。