こんにちは、樋口です。書き込みありがとうございます。
> あるデータを前処理しようとするとエラーがでるのですが、それを分割して
> 前処理をするとエラーが出ません。
ver 2.00に中国語データを投入した場合、文字化けによって、こういうことが
起こっても不思議ではありません。
また、タグの失敗があっても、後続のデータが少ない場合にはエラーにならな
いこともあり得ます。
データが大きすぎると問題が生じることもありえますが、GB単位の話であり、
この可能性は低いと思います。
ということで、ひとまず以下をお勧めします。
(1) ver 2.00で統合データのプロジェクトを開き、「分析対象ファイルのチ
ェック」を実行し、タグ関連の問題が出ないかどうかを確認してください。
文字化けは無視して、タグ・見出し関連の問題が発見されないかどうかを確
認してください。もし発見されたらデータを修正してください。
繰り返しますが、ver 2.00では中国語は扱えませんので、ここでver 2.00の
役目は終わりです。
(2) その上で、ver 3(アルファ版)で統合ファイルの前処理を試してみると
どうでしょうか。新規プロジェクトの作成時には「中国語」を選択してくだ
さい。