[掲示板へもどる]
一括表示

  [No.349] 抽出語に関して 投稿者:藤本美紀  投稿日:2008/02/15(Fri) 18:11:01

藤本と申します。
以前,KHCoderが起動しなかったので,質問した者ですが,
アドバイスとおりにやってみて,起動するようになりました。
ありがとうございました。

また,語の抽出について質問がありますので,よろしくお願いしますす。

ある文書を前半,後半に分けるために,<h1>前半</h1>,<h1>後半</h1>を使って分けました。
前半と後半別に,ある語の数を調べたいのですが,ツール−文書−連関規則を使うと,ある語が出現する文書の数しか求まりません。
文書の数ではなく,語の出現回数を文書のパート別に求める機能はないのでしょうか?


  [No.350] Re: 抽出語に関して 投稿者:HIGUCHI Koichi  投稿日:2008/02/15(Fri) 20:04:48

こんにちは、樋口です。書き込みありがとうございます。

「文書x抽出語」表には、パートごとに語の出現数を数えた結果が整理されています。

この表を作成する手順ですが、「ツール」→「文書」→「「文書x抽出語」表の出力」→「CSVファイル」と順にクリックして下さい。

開いた画面の「集計単位の選択」のところで「H1」を選択します。そして、目的の語が出力されて、なおかつ出力される語の数が250程度以下になるように、品詞や最小出現数などを指定してください。「OK」をクリックして保存したファイルをExcelで開けば、出力した語について、前半と後半での出現数を見ることができます。

※「250程度以下」というのは、Excelで見ることができるのが255列目までだからです…。


  [No.351] 別解 // Re: 抽出語に関して 投稿者:HIGUCHI Koichi  投稿日:2008/02/15(Fri) 21:46:30

もし調べたい語が1つとか2つでしたら、下記の手順の方が手軽かもしれません。

「ツール」→「SQL文入力」→「SELECT」をクリックして、入力部分に以下のSQLを貼り付けます。

#--------------------------------------------------#
SELECT h1_id, COUNT(*)
FROM hyosobun, hyoso, genkei
WHERE
genkei.name = "ある語"
AND hyosobun.hyoso_id = hyoso.id
AND hyoso.genkei_id = genkei.id
GROUP BY h1_id
ORDER BY h1_id
#--------------------------------------------------#

あとは「ある語」となっている部分を、目的の語に変えて、「実行」をクリックしてください。表示される「h1_id」は<H1>タグで括られたいくつ目の部分を表す数値で、「COUNT(*)」の列が語の出現数です。