[掲示板へもどる]
一括表示

  [No.3164] 自動実行プラグインでの特徴語の抽出 投稿者:Suita  投稿日:2017/09/25(Mon) 19:42:15

[1]KH Coderのバージョン: 2.00f
[2]こころのチュートリアルデータでも同じ問題が再現。
[3]エラーメッセージ:Entry "0" not found at /<C:\khcoder\kh_coder.exe>Tk.pm line 250, <SOURCE> line 438.

以下のプロセスをauto_runプラグインで自動化しようとしています。

 プロジェクトの作成→語の取捨選択→前処理→外部変数と見出し→関連語検索→共起ネットワークの作成→保存

このうち、「外部変数と見出し」のメニューで、

 1.変数リストから文書単位h1を選択
 2.単位を文にする
 3.値とラベルの一覧から一番上項目を選択
 4.特徴語の抽出

と処理を行いたいのですが、3.の処理で上記のエラーメッセージが出て選択できません。

選択する前に、値とラベルの一覧を更新する必要があると思うのですが、
どのように記述すればよいでしょうか。

試作したコードは以下の通りです。

my $win = gui_window::outvar_list->open;
$win->{list}->selectionSet(0);
$win->_delayed_open_var;
$win->{opt_tani}->set_value('bun');
$win->{opt_tani}->mb_refresh;
$win->{list_val}->selectionSet(0);
$win->v_words;

よろしくお願いします。


  [No.3165] Re: 自動実行プラグインでの特徴語の抽出 投稿者:HIGUCHI Koichi  投稿日:2017/09/25(Mon) 23:19:30

こんにちは、樋口です。書き込みありがとうございます。

> プロジェクトの作成→語の取捨選択→前処理→外部変数と見出し→関連語検索
> →共起ネットワークの作成→保存

もし、扱っている変数がどんな値を持つかを把握しておられるなら、「外部変
数と見出し」を飛ばして、直接「関連語検索」に進むのが良いかと思います。
「<>変数名-->値」のように入力して検索すれば、目的を果たせるはずです。

「外部変数と見出し」画面を開かないと、変数の名前や値が分からないという
ことでしょうか?


  [No.3167] Re: 自動実行プラグインでの特徴語の抽出 投稿者:Suita  投稿日:2017/09/26(Tue) 12:49:21

樋口先生

早速のお返事ありがとうございます。

「外部変数と見出し」の検索結果の全見出しに対して、繰り返し
共起ネットワークを作成することを考えていたので、
直接入力は思いつきませんでした。

確かに、見出しの一覧は事前に分かっているので、
仰る通り、直接関連語検索をする方が手っ取り早いですね。

#関連語(特徴語)検索
my $win_a = gui_window::word_ass->open;
$win_a->{opt_order}='sa';
#$win_a->{direct_w_e}->delete('0','end');
$win_a->{direct_w_e}->insert('end',$win_a->gui_jchar('<>見出し1-->上_先生と私'));
$win_a->{tani_obj}->{raw_opt} = 'bun';
$win_a->{tani_obj}->mb_refresh;
$win_a->search;

#関連語(特徴語)検索のオプション
my $win_ao = gui_window::word_ass_opt->open;
$win_ao->{ent_limit}->delete('0','end');
$win_ao->{ent_limit}->insert('end','100');
$win_ao->save;

#特徴語共起ネットワーク作成
$win_a->net_calc;


的確なご指摘で大変助かりました。ありがとうございました。


併せてお伺いしたいのですが、特徴語の基準として、チュートリアルおよびソフトのデフォルトでは
Jaccard係数を使っているようですが、これには何か根拠があるのでしょうか。
文献等ご指摘いただけると幸いです。


  [No.3169] Re: 自動実行プラグインでの特徴語の抽出 投稿者:HIGUCHI Koichi  投稿日:2017/09/26(Tue) 23:06:15

こんにちは、樋口です。書き込みありがとうございます。

「書き添えてください」とお願いしている情報を実際に書いてくださる方があ
まり多くはいらっしゃらない中で、お願いしている情報に加えて、解決方法(
コード)までお示しいただき、大変ありがとうございます。

Jaccard係数については、具体的に「この用途(計量テキスト分析)に適して
いる」と書かれているわけではないのですが、下記の書籍(p. 177〜)に書か
れた特徴を読んで、この用途に適していようかと私は判断しています。

『実例クラスター分析』
http://amzn.to/1DrT9Ve