[掲示板へもどる]
一括表示

  [No.3197] coder_dataの中身について 投稿者:inukaburi  投稿日:2017/10/06(Fri) 00:35:34

こんばんは。夜分に失礼します。
Mac OS X 10.10.5で2.00eを動かしています。
問題なく分析が行えていますが、分析後に分析対象のファイルが入ったフォルダに「coder_data」というフォルダができます。これ自体には問題なく共起ネットワークや抽出の結果データが入っていて便利なのですがその他に、「(分析対象の)ファイル名_ch.txt」と「(分析対象の)ファイル名_mph.txt」というファイルが出現し、それを開こうとしても「テキストエンコーディング Unicode(UTF-8)に対応していません」とでてきます。このファイルの中身は何なのでしょうか?分析結果に必要のないファイルなら開けなくてもそのままでいいと思うのですが、念のためお聞きしたいです。宜しくお願いします


  [No.3198] Re: coder_dataの中身について 投稿者:HIGUCHI Koichi  投稿日:2017/10/06(Fri) 14:21:55

こんにちは、樋口です。書き込みありがとうございます。

> 「(分析対象の)ファイル名_ch.txt」

茶筌による形態素解析(語の取り出し)結果が入っているファイルです。

> 「(分析対象の)ファイル名_mph.txt」

分析対象ファイルを、茶筌に投入できるように微修正したファイルです。
いずれもテキストエディタ「mi」なら開いて中を確認できるはずです。
https://www.mimikaki.net/


なお、「coder_data」内のファイル群は自動的に生成されますが、
自動的に削除されることもあります。残しておく必要がある分析結果
等は、別の場所に、別名で保存しておいてください。