いえいえ、データの形については一概に間違いというようなことは
ありません。むしろ、こちらでは想定していなかった形と言う方が
正確でしょう。
それに、今まできちんと把握していなかったKH Coderの仕様も、お
かげさまで明らかになりました。<H1>〜<H5>タグで括る見出し部分
が全角で約4000字を越えると「データの整合性」エラーが発生する
ようです。KH Coder 2.xでは、<H1>〜<H5>タグは、純粋に見出し用
に使っていただいた方が安全なようです。
また、文字化け部分を含む行については、ChaSenによるその行の解
析結果が希におかしくなることがあるようです。通常は大きな問題
ではありませんが、これが見出しの行だと、HTMLタグが消失し、
「データの整合性」エラーにつながる場合があるようです。
(茶筌 ver. 2.03b9 Windows版の場合)