Re: 中国語データの分析 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.2185] Re: 中国語データの分析 投稿者:HIGUCHI Koichi  投稿日:2015/09/11(Fri) 12:23:03

こんにちは、樋口です。書き込みありがとうございます。

> あるデータを前処理しようとするとエラーがでるのですが、それを分割して
> 前処理をするとエラーが出ません。

ver 2.00に中国語データを投入した場合、文字化けによって、こういうことが
起こっても不思議ではありません。

また、タグの失敗があっても、後続のデータが少ない場合にはエラーにならな
いこともあり得ます。

データが大きすぎると問題が生じることもありえますが、GB単位の話であり、
この可能性は低いと思います。


ということで、ひとまず以下をお勧めします。


(1) ver 2.00で統合データのプロジェクトを開き、「分析対象ファイルのチ
ェック」を実行し、タグ関連の問題が出ないかどうかを確認してください。
文字化けは無視して、タグ・見出し関連の問題が発見されないかどうかを確
認してください。もし発見されたらデータを修正してください。

繰り返しますが、ver 2.00では中国語は扱えませんので、ここでver 2.00の
役目は終わりです。

(2) その上で、ver 3(アルファ版)で統合ファイルの前処理を試してみると
どうでしょうか。新規プロジェクトの作成時には「中国語」を選択してくだ
さい。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)