樋口様、ありがとうございます。ここの部分が一致していないようです。原データでは28、733行あるのですが、ケース数は文34、255 段落12、679となってしまいます。ちなみに各段落の文章は下記かっこ内「数字(段落数) ・文 ・文」 といった構成となっています。