樋口先生
ご教示ありがとうございました。
> 「だ and ある and 。」ですと、「だ」「ある」「。」が連続していなくてヒ
> ットしてしまいます。これを「だ+ある+。」に変更していただきますと、KWIC
> と同じヒット数になろうかと思います。
はい、おっしゃる通りにいたしましたところ、KWICでの検索結果と同じ値(2624)が得られました。
>
> なお、文末表現ということでしたら、必ずしも「だ」「ある」といった語にこ
> だわらずに、「'である。'」というシングルクォートを使った文字列指定のほ
> うが簡単・確実やもしれません。
「だ+ある+。」の場合は、「ある」が「あった」(=であった。)もカウントされると思いますが、このシングルクォートで囲んだ場合も「であった」はカウントされますでしょうか。それとも、「である。」という現在形のみがカウントされますでしょうか。
試しに、
*である
'である。'
*であった
'であった。'
として集計したところ、'である。'は2652、'であった。'は898となりました。この数字からすると、'である。'には過去形の'であった。'も含まれているような気がするのですが・・・(数字は少し多めですが)。
もう1点、集計した際に、コーディング単位を「文」、集計単位をH1(小説ごと)としたときに、数字の右側に「ケース数」というものが出てまいります。これは1つの小説の「文」の数を表しているのでしょうか。
何度も基本的な質問ばかりで申し訳ございません。
どうぞよろしくお願いいたします。