なかのと申します。たびたびおじゃまします。大量の構造化された文書を分析しようとしています。その中で、必ず「前処理データの整合性が失われました」というエラーが出る箇所がありす。いろいろ試してみましたが、どうも<h1></h1>で囲まれた最後(つまりは、</h1>の直前)に未知語があるとエラーになるようです。linux版での現象です。以上、とりあえず御報告まで。