川上先生 お世話になります、樋口です。こちらこそ、先日は大変ありがとうございました。 若輩の身でございますので、どうぞ次回より「先生」はご容赦下さいませ。 さて、「抽出語・連関規則」では、データ全体を見た時よりも、出現の確率(割合) が上がっているかどうかということを問題にしております。 おっしゃるとおり、「中」でも43の段落に出現しているのですが、「中」には全 部で289の段落があり、「先生」が出現する段落の割合は約14.9%となります。 これにたいして、データ全体を見ますと全1215段落のうち、先生が出現している 段落は309(25.4%)です。「中」に注目した場合、データ全体よりも、「先生」 を含む段落の割合が減少しております。 このため、「抽出語・連関規則」で「中」を検索した場合、「先生」はリストア ップされません。「抽出語・連関規則」では、データ全体を見た場合よりも出現 確率が上がっている語だけをリストアップいたします。これはランダムに「上」 「中」「下」に散らばっている言葉ではなく、「中」に集中している語を探そう (「中」に特徴的にあらわれる語を探そう)という考え方にもとづく挙動でござ います。 したがいまして、「確率もしくは割合ではなく、数を!」という場合には、「抽 出語・連関規則」コマンドはあまり適しておりません。まさに行っていただきま したように、コーディングルールを作成して、カウントしていただく必要がござ います。 # あるいは、「上」だけ「中」だけ「下」だけを入力したテキストファイルを3つ # 作成し、別々にKH Coderに登録していただくなど…。 KH Coderには未だ扱いにくい・分かりにくい部分も残っているために、何かとお 手数をおかけしているのではないかと恐縮でございますが、どうぞよろしくお願 い申し上げます。