Re: 別形式での抽出結果表示 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.165] Re: 別形式での抽出結果表示 投稿者:HIGUCHI Koichi  《URL》   投稿日:2006/05/27(Sat) 00:04:01

樋口です。ご無沙汰しております。
書き込みありがとうございます。

いずれの形式にしても、SQLだけでは苦しいと思います。(SQLを極めれば
どうか分かりませんが、おそらく、SQLで取得したデータをPerl等で整形
するのが近道であろうかと思われます)

対策なのですが、こちらから新しいバージョンのKH Coderをダウンロード
していただけますでしょうか。これは、近い将来に2.b.7として、公開す
る予定のものです。「plugin」というフォルダが、kh_coder.exeと同じ場
所にあるのが、このバージョンの特徴です。
http://khcoder.info/psnl/.khc/khcoder-2b7%5bpre%5d.zip
(kh_coder.exeを上書きし、pluginフォルダをコピーして下さい)

加えて、ちょっと急ごしらえのものなのですが、下記ファイルをダウンロ
ードして、当該の「plugin」フォルダにコピーして下さい。コピーしてか
らKH Coderを起動すると、メニューの「ツール」「プラグイン」という箇
所に新しいコマンドがあらわれると思います。
http://khcoder.info/psnl/.khc/matsukawa_san.pm

この新しいコマンドをお使いいただけば、【1】の形式での出力が行えます。
現状では、抽出語が存在しない品詞の列、すなわち空の列も作成されるので
すが、これを作成しないようにするためには、matsukawa_san.pmをテキスト
エディタで開き、58行目付近を以下のように修正して下さい。

修正前:
		SELECT khhinshi.name
		FROM   khhinshi, hselection
		WHERE
			khhinshi.id = hselection.khhinshi_id
			AND hselection.ifuse = 1
		ORDER BY khhinshi.id

修正後:
		SELECT khhinshi.name, sum(genkei.num) as freq
		FROM   khhinshi, hselection, genkei
		WHERE
			khhinshi.id = hselection.khhinshi_id
			AND khhinshi.id = genkei.khhinshi_id
			AND hselection.ifuse = 1
		GROUP BY khhinshi.id
		ORDER BY khhinshi.id

なお、データ中にH1〜H5までのタグがある場合、このコマンドの出力は不正
確なものになります。ご注意下さい。なにぶん急ごしらえのものですので、
その他にもご質問等ございましたら、ご遠慮なくお問い合わせ下さい。

それでは、どうぞよろしくお願いいたします。

p.s.
【1】のような形式は、「目で見て確認するために」ということでしょうか?
この形式のファイルを統計ソフト等でどのように使うのか、ちょっと想像でき
なかったですが、、、差し支えなければ、ご教示下さいませ。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)