Re: クラスタ分析のターム・文書行列 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.782] Re: クラスタ分析のターム・文書行列 投稿者:HIGUCHI Koichi  投稿日:2011/05/19(Thu) 11:01:21

こんにちは、樋口です。書き込みありがとうございます。

> ターム・文書行列(term-document matrix)の出力

えっと、もともとエラーが出て動いていないnewproject.plに追加しても、意
味がありません。

うまく動いている方(doc_cls.pm)では、$self->hinshiの中身としてどんな
ものがmysql_crossout::csvに送られているのかをまず確認するのです。その
ためには、doc_cls.pmに、print Dumper(...);を追加します。

そして、メニュー操作でクラスター分析を実行すれば、print Dumper(...);が
実行されて、hinshiオプションの中身がコンソールに表示されるでしょう。
これを見れば、変数のタイプも内容も明らかになります。

どんなものがmysql_crossout::csvのhinshiオプションとして使われているの
かが分かれば、あとは、同様のものを手で作成してnewproject.plに追加する
と良いでしょう。

> また、mysql_crossout::csv->new->runをスムースに実行すると、csvファイ
> ルが直接に出力しますか?もしくは、抽出語リストと同様、次のようにopen
> 必要となりますか?

mysql_crossout::csv->new(
file => $file_csv,
(以下略)
);

というコマンドでは、fileオプション(すなわち$file_csvの中身)でファイ
ル名を指定しています。指定されたファイルに、データが出力されます。

で、そのファイルをご自身で開いて確認するのが面倒なので、自動的にExcel
を起動したい場合にはgui_OtherWin->open($file_csv);を実行すると良いで
しょう。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)