こんにちは、樋口です。
書き込みありがとうございます。
また、テスト用データをお送りいただき感謝申し上げます。
原則としてKH Coderで分析するファイルには、1種類の言語のテキストだけしか
入力できません。複数の言語が混在するテキストファイルを扱うことはできま
せん。
他言語の文字や、ある種の絵文字が含まれていると、エラーが生じる場合があ
ります。
そこで、そうした問題の生じる文字を自動的に削除する(「?」に変換する)
ようにしました。このバージョンを3.Alpha.08eとして公開しましたので、こち
らをお試し下さい。
http://khc.sourceforge.net/dl3.html
なお、中国語を分析する場合であれば、中国語の文字コード(cp936)で定義さ
れていない文字をすべて「?」に変換することで、エラーを防止しています。