樋口先生
誤解を与えて申し訳ありません。樋口先生の書いた文をきちんと読んでいないのではなく、無知ゆえに、もしかしてMeCab単体を動作させると同時にKH Coderの前処理もクリックする必要があるのかもしれない、と思ったからです。
稚拙な文に丁寧にご対応いただきありがとうございます。
「input-buffer overflow」は、その状態でも現れます。
File Mergeで調べたところ、行数が増えた原因は
元からあった「kokoro2_ch.txt」の
<H2><H2><H2>
〜
</H2></H2></H2>
のように挟まれている部分が
七 ナナ 七 名詞-数
EOS
七 ナナ 七 名詞-数
のように同じ文がEOSを挟んで再び出現していることが原因で
これが371行分増加させています。
他にも増加とは関係ありませんが
Kがアルファベットとして分類されるかタグとして分類されるなどの違いがありました。
「kokoro2_mph.txt」と「kokoro2.txt」の違いは一切ありませんでした。
行数も一致しています。