[掲示板へもどる]
一括表示

  [No.150] 文書検索 抽出語の動作について 投稿者:本田朋子  投稿日:2006/04/13(Thu) 15:03:05

はじめまして。ただ今、博論執筆中で、KH Coderを利用し始めた本田と申します。
非常に基本的なことを、どなたかご教示いただければと思います。

ツールバーの文書から、文書検索、および抽出語、連関規則を作動させるために、
すでに作成したテキスト文書をリーロードすることが適切にできません。
ファイルを参照で選択すると、左のコード選択にはタイトルなどが出るのですが、
下のResultには何も表示されません。テキスト文書の作成に問題があるのか、色々
試したのですが、だめなようです。

よろしくお願いいたします。

本田


  [No.151] Re: 文書検索 抽出語の動作について 投稿者:HIGUCHI Koichi  《URL》   投稿日:2006/04/13(Thu) 20:19:00

こんにちは、樋口です。書き込みありがとうございます。

左の「コード選択」部分で「#直接入力」を選択し、右の入力欄に単語を1つ入力
して、「検索」をクリックした場合はどうでしょうか?

これで検索ができる場合には、コーディングルール・ファイルの書き方に何か間違
い(というか、KH Coderの仕様に沿っていない部分)があったものと思われます。
この場合には、差し支えのない範囲で、コーディングルール・ファイルの内容をコ
ピー&ペーストして見せていただけましたら、より具体的におこたえできるかと思
います。
# コーディングルール・ファイル中の単語部分を、実際にはお使いでないものに
# 変えた上で、見せていただけましたら、差し障りも生じにくいかと思われます。

あとは、「tutorial」フォルダ内のコーディングルール・ファイル「theme.cod」を
メモ帳などでご覧いただけましたら、もしかすると、何かのヒントになるかもしれ
ません。

それでは、よろしくお願いいたします。


  [No.152] Re: 文書検索 抽出語の動作について 投稿者:本田朋子  投稿日:2006/04/15(Sat) 12:01:10

樋口様

お返事ありがとうございます。

コーディングルールに沿った集計はできたのですが、連関規則において、章ごとに高い確率で出現する語の検索は依然としてできませんでした。

一応、コーディングファイルの内容(章・コーディングルール)を下に貼り付けいたしますので、ご覧になっていただいて何か問題がりましたら、ご指摘いただけると助かります。


Part.cod

*理念
<>見出し1-->理念
---------------------------------------------------------------
(管理者によって中略されました)
---------------------------------------------------------------

Theme.cod

*ODA
海外 or 開発 or 協力 or 援助 or 開発途上国
---------------------------------------------------------------
(管理者によって中略されました)
---------------------------------------------------------------


よろしくお願いいたします。

本田


  [No.153] Re: 文書検索 抽出語の動作について 投稿者:HIGUCHI Koichi  《URL》   投稿日:2006/04/15(Sat) 14:27:06

こんにちは、樋口です。書き込み有り難うございます。

コーディングルール・ファイルに特に問題は見あたらないようで、どうも私の
勘違いだったようです。申し訳ございません。

「抽出語 連関規則」ですが、コードを1つ選択(クリック)し、「集計」ボタ
ンをクリックすると、画面下部(左側)の「文書数:」のところに数字が表示
されると思います。この数字はどうなっていますでしょうか?
ここには、「コーディング→単純集計」コマンドで計算される各コードの「頻
度」と同じ数値が表示されるはずなのですが、いかがでしょうか。(コーディ
ング単位・集計単位が同じであればの話ですが) 

また、コーディングルール・ファイルの問題ではないようですので、関係ない
かもしれませんが、「抽出語 連関規則」の画面で「#直接入力」を選択し、
「code」を選択した上で、直接入力部分に「海外 or 開発 or 協力 or 援助 
or 開発途上国」と入力し、「集計」ボタンをクリックした場合も、結果は変
わりませんでしょうか。

あと、上記に加えてお試しいただきたいのは、「抽出語 連関規則」の画面で
「集計単位:」を「文」や「段落」としてから、「集計」を行っていただくと
いうことです。

要領を得なくて申し訳ないのですが、今思いつくの上記のような所です。
お試しいただけましたら幸いです。


  [No.154] Re: 文書検索 抽出語の動作について 投稿者:本田朋子  投稿日:2006/04/18(Tue) 23:05:34

樋口様

お返事ありがとうございました。すぐレスができず失礼しました。


> 「抽出語 連関規則」ですが、コードを1つ選択(クリック)し、「集計」ボタ
> ンをクリックすると、画面下部(左側)の「文書数:」のところに数字が表示
> されると思います。この数字はどうなっていますでしょうか?
> ここには、「コーディング→単純集計」コマンドで計算される各コードの「頻
> 度」と同じ数値が表示されるはずなのですが、いかがでしょうか。(コーディ
> ング単位・集計単位が同じであればの話ですが)

47の数字が出ました。
>
> また、コーディングルール・ファイルの問題ではないようですので、関係ない
> かもしれませんが、「抽出語 連関規則」の画面で「#直接入力」を選択し、
> 「code」を選択した上で、直接入力部分に「海外 or 開発 or 協力 or 援助
> or 開発途上国」と入力し、「集計」ボタンをクリックした場合も、結果は変
> わりませんでしょうか。

上と同じく、47という数字が出ました。

> あと、上記に加えてお試しいただきたいのは、「抽出語 連関規則」の画面で
> 「集計単位:」を「文」や「段落」としてから、「集計」を行っていただくと
> いうことです。

了解しました。ただし、いまだに、章ごとの特徴づける言葉が「抽出語 連関規則」から拾えないのが、ちょっと残念なんです。
ご丁寧にアドバイス本当にありがとうございました。

本田


  [No.155] Re: 文書検索 抽出語の動作について 投稿者:HIGUCHI Koichi  《URL》   投稿日:2006/04/19(Wed) 00:07:20

こんにちは、樋口です。書き込み有り難うございます。
ご返信は、お手すきの折でまったく問題ございません。

> > 「抽出語 連関規則」ですが、コードを1つ選択(クリック)し、「集計」ボタ
> > ンをクリックすると、画面下部(左側)の「文書数:」のところに数字が表示
> > されると思います。この数字はどうなっていますでしょうか?
> > ここには、「コーディング→単純集計」コマンドで計算される各コードの「頻
> > 度」と同じ数値が表示されるはずなのですが、いかがでしょうか。(コーディ
> > ング単位・集計単位が同じであればの話ですが)
>
> 47の数字が出ました。
> >
> > また、コーディングルール・ファイルの問題ではないようですので、関係ない
> > かもしれませんが、「抽出語 連関規則」の画面で「#直接入力」を選択し、
> > 「code」を選択した上で、直接入力部分に「海外 or 開発 or 協力 or 援助
> > or 開発途上国」と入力し、「集計」ボタンをクリックした場合も、結果は変
> > わりませんでしょうか。
>
> 上と同じく、47という数字が出ました。

「これらの場合(Theme.codを利用または単語を直接入力した場合)には、Result
の覧に、特に高い確率で出現する語の一覧が表示されるけれど、Part.codを利用
した場合にはうまくいかない」
という状況なのだろうかと推測・理解したのですが、この理解であっております
でしょうか。

もし仮に上記のような状況だとしますと、まず、「コーディング→単純集計」コ
マンドで、コーディング単位を「文」とし、Part.codによる集計を行ってみてく
ださい。これによって、「理念」の章にはいくつの文が含まれているのか、
といった集計が行えるはずです。この集計が成功するようでしたら、おそらく、
何も問題は無いはずです。

「抽出語 連関規則」の画面で、集計単位を「文」として、Part.codを開き、コー
ド選択の部分で「理念」を選択し、「集計」ボタンをクリックしてください。
これによって、「理念」の章で、文中に出現する確率が特に高い語(特徴的な語)
がリストアップされるはずです。

お伝えいただいた範囲からは状況を十分に理解できていないかもしれず、仮定の
多い返信となってしまいましたが、どうぞご容赦下さいませ。


  [No.156] Re: 文書検索 抽出語の動作について 投稿者:本田朋子  投稿日:2006/04/21(Fri) 20:39:24

樋口様

いつもご丁寧なお返事ありがとうございます。

> もし仮に上記のような状況だとしますと、まず、「コーディング→単純集計」コ
> マンドで、コーディング単位を「文」とし、Part.codによる集計を行ってみてく
> ださい。これによって、「理念」の章にはいくつの文が含まれているのか、
> といった集計が行えるはずです。この集計が成功するようでしたら、おそらく、
> 何も問題は無いはずです。
>
> 「抽出語 連関規則」の画面で、集計単位を「文」として、Part.codを開き、コー
> ド選択の部分で「理念」を選択し、「集計」ボタンをクリックしてください。
> これによって、「理念」の章で、文中に出現する確率が特に高い語(特徴的な語)
> がリストアップされるはずです。

ご指示のように操作しましたが、エラーが出て「Can't use an undefined value as an ARRAY reference at /PerlApp/kh_cod/func.pm line 338.」というメッセージが出ます。どういう問題が存在するか、おわかりになったらご教示いただけると助かります。
稚拙な質問で誠に恐縮ですが、よろしくお願いいたします。

本田


  [No.157] Re: 文書検索 抽出語の動作について 投稿者:HIGUCHI Koichi  《URL》   投稿日:2006/04/21(Fri) 22:54:42

こんにちは、樋口です。書き込み有り難うございます。

数字を振ってみました:
> もし仮に上記のような状況だとしますと、まず、「コーディング→単純集計」コ
> マンドで、(a1)コーディング単位を「文」とし、(a2)Part.codによる集計を行っ
> てみてください。これによって、「理念」の章にはいくつの文が含まれているの
> か、といった集計が行えるはずです。この集計が成功するようでしたら、おそら
> く、何も問題は無いはずです。
>
> 「抽出語 連関規則」の画面で、(b1)集計単位を「文」として、(b2)Part.codを
> 開き、(b3)コード選択の部分で「理念」を選択し、(b4)「集計」ボタンをク
> リックしてください。これによって、「理念」の章で、文中に出現する確率が
> 特に高い語(特徴的な語)がリストアップされるはずです。

おそらく、エラーが出たのは、(a2)のあたりかと思われます。
(もし違っていましたら、ご教示下さいませ)

このエラーは、コーディングルール・ファイルに含まれる全てのコードに関して、
条件に該当する文(文書)が無かった場合に生じるものです。
# すべてのコードの「頻度」が0と表示されずに、エラーが出るのはKH Coderの
# バグです。次のバージョンで修整させていただきます。

そうすると、問題がありそうな箇所は、おそらく分析対象ファイルではないかと
思われます。分析対象ファイルに、

<H1>理念</H1>

といった見出しの行が入っており、こういった見出し行で各章が区切られている
かどうかを、再度ご確認いただけますでしょうか。
これでうまくいかないようでしたら、分析対象ファイルとPart.codをメールでお
送りいただけましたら、こちらでチェックさせていただきます。この方法につい
ても、ご一考いただけましたら幸いです。

それでは、どうぞよろしくお願いいたします。


  [No.161] ファイル編集はテキストエディタで 投稿者:HIGUCHI Koichi  《URL》   投稿日:2006/05/05(Fri) 01:40:13

ひとまず今回の問題は解決したのことで、なによりです。

いずれFAQに追加しようかと考えていますが、データファイルの作成には、メ
モ帳や秀丸のようなテキスト・エディタをお使い下さい。これは重要なこと
なのですが、マニュアル等にはきちんと書いていなかったように思います。
申し訳ございません。

というのも、Internet ExplorerのようなWebブラウザは、「<h1>理念</h1>」
といった部分があると、「あ、ここは見出しなんだな。じゃあ、大きい文字で
表示してあげよう」という解釈をします。そして、「理念」を大きな文字で表
示し、<h1>のようなタグは画面に表示しません。つまり、ファイルに書かれて
いる内容をそのまま表示するのではなく、独自の解釈でもって、ある部分を強
調表示したり、ある部分を表示しなかったりします。

したがって、分析対象ファイルを作成する際には、ファイルに書かれている内
容をそのまま表示してくれるソフト、すなわち「メモ帳」「秀丸」のようなテ
キストエディタをご利用いただく必要があります。