こんにちは、樋口です。書き込みありがとうございます。
<h1><h2>の見出しを削除すると前処理が完了する場合、可能性が高いと考えら
れるのは、見出しの記入にミスがあったということです。
たとえば「<h1見出し内容</h1>」のように「>」が抜けたり、あるいは「<h1>
見出し内容<h1>」のように「/」が抜けたりすると、エラーになります。こう
したミスは、前処理の実行前に「分析対象ファイルのチェック」コマンドを使
うことで、ある程度まで自動検出することができます。あとは、コピー&ペー
ストを多用しながら、気をつけて見出しを入力していただくくらいでしょうか。
あるいは、見出しを入れるのではなく、Excel/CSV形式のファイルをお使いい
ただくのも良いかと存じます。
https://www.slideshare.net/khcoder/data-preparation-for-kh-coder