Re: 抽出語・連関規則の使い方について (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.204] Re: 抽出語・連関規則の使い方について 投稿者:HIGUCHI Koichi  《URL》   投稿日:2006/10/06(Fri) 21:58:57

川上先生
お世話になります、樋口です。こちらこそ、先日は大変ありがとうございました。
若輩の身でございますので、どうぞ次回より「先生」はご容赦下さいませ。

さて、「抽出語・連関規則」では、データ全体を見た時よりも、出現の確率(割合)
が上がっているかどうかということを問題にしております。

おっしゃるとおり、「中」でも43の段落に出現しているのですが、「中」には全
部で289の段落があり、「先生」が出現する段落の割合は約14.9%となります。
これにたいして、データ全体を見ますと全1215段落のうち、先生が出現している
段落は309(25.4%)です。「中」に注目した場合、データ全体よりも、「先生」
を含む段落の割合が減少しております。

このため、「抽出語・連関規則」で「中」を検索した場合、「先生」はリストア
ップされません。「抽出語・連関規則」では、データ全体を見た場合よりも出現
確率が上がっている語だけをリストアップいたします。これはランダムに「上」
「中」「下」に散らばっている言葉ではなく、「中」に集中している語を探そう
(「中」に特徴的にあらわれる語を探そう)という考え方にもとづく挙動でござ
います。

したがいまして、「確率もしくは割合ではなく、数を!」という場合には、「抽
出語・連関規則」コマンドはあまり適しておりません。まさに行っていただきま
したように、コーディングルールを作成して、カウントしていただく必要がござ
います。
# あるいは、「上」だけ「中」だけ「下」だけを入力したテキストファイルを3つ
# 作成し、別々にKH Coderに登録していただくなど…。

KH Coderには未だ扱いにくい・分かりにくい部分も残っているために、何かとお
手数をおかけしているのではないかと恐縮でございますが、どうぞよろしくお願
い申し上げます。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)