[掲示板へもどる]
一括表示

  [No.1020] 特定の語を含むテキストレコードを対象とした「文書×抽出語」、「抽出語×文脈ベクトル」表 投稿者:袋井  投稿日:2012/08/15(Wed) 20:58:19

樋口先生さま

お世話になります、袋井と申します。

先日は、表記ゆれを吸収した、「文書×抽出語」、「抽出語×文脈ベクトル」表の扱いについて、
ご丁寧に分かりやすくご教示いただき、ありがとうございました。

今回も引き続き、この関連で教えていただきたいことがございます。
よろしくお願いいたします。

特定の語(例えば、「意識」「お客様」「対応」など ※)を含むテキストレコードのみを対象として、
「文書×抽出語」、「抽出語×文脈ベクトル」表を作成したいと考えております。

操作は煩雑になっても構いませんので、
標準メニューを組み合わせることでできるようならば、その操作を教えていただけませんか。

よろしくお願いいたします。

※コーディングファイルのルールに従って記述するものとします


  [No.1021] Re: 特定の語・コードを含む文書だけの処理 投稿者:HIGUCHI Koichi  投稿日:2012/08/16(Thu) 04:26:55

こんにちは、樋口です。書き込みありがとうございます。

これについては、残念ながら今のところ、本当に煩雑な方法しかありません。
いったん、該当文書だけを別のテキストファイルに書き出し、そのファイルを
別途プロジェクトとしてKH Coderに登録する方法です。

まず、(1)以下のようなコーディングルールを作成します。

> *抽出用
> 意識 or 'お客様' or 対応

そして(2)KH Coderのメニューから「ツール」「テキストファイルの変形」
「部分テキストの取り出し」とたどります。ここで「特定のコードが与えられ
た文書だけを取り出す」を選択して、当該のコーディングルールファイル/コ
ードを選択して「OK」をクリックします。

※外部変数を読み込んでいる場合には、該当文書だけを書き込んだテキストフ
ァイルに加えて、該当文書の変数の値を保存したCSVファイルが作成されます。

(3)取り出したファイルを新たなプロジェクトとしてKH Coderに登録し、各
種の処理を行って下さい。

手数がかかるので、いろいろな条件で試行錯誤をするのは厳しいものがありま
すが、KH Coder上ですべての処理を行うとすると、この方法くらいかなぁと思
います。以上、取り急ぎご返信までに。


  [No.1023] Re: 特定の語・コードを含む文書だけの処理 投稿者:袋井  投稿日:2012/08/16(Thu) 19:55:22

樋口先生さま

お世話になります、袋井と申します。

ご教示いただき、誠にありがとうございます。

できることがわかりましたので、本当に助かりました。

さっそく活用させていただきます。