こんにちは、樋口です。書き込みありがとうございます。
シングルクォートで囲んだ場合は、語ではなく文字列がチェックされます。「
'である。'」と指定した場合、「である。」という文字列があるかどうか、す
なわち「で」「あ」「る」「。」という4文字が続いているかどうかがチェッ
クされます。したがいまして、「であった。」はカウントされません。
> 試しに、 ... として集計したところ、 ...
余談ですが、コーディングルールを試す際には、「ツール」「文書」「文書検
索」コマンドが便利ですので、よろしかったらお試し下さい。
なお、文字列指定の方がやや数が多くなると思います。「である」の「で」は、
茶筌によって「だ」と解析される場合がほとんどですが、「で」と解析される
場合も時折あるようです。「だ+ある+。」では後者の場合を拾えないので、文
字列指定の方がわずかに数が多くなります。
> 集計した際に、コーディング単位を「文」、集計単位をH1(小説ごと)とした
> ときに、数字の右側に「ケース数」というものが出てまいります。これは1つ
> の小説の「文」の数を表しているのでしょうか
はい、そうなります。ただし、KH CoderはH1タグで括られた見出しも1文と数
えていますのでご注意ください。