樋口先生
>その状態で、KH Coderの前処理を試みると
これはターミナルで
>mecab -Ochasen -o output.txt kokoro2.txt
を入力した後に
XQuartzでKH Coderを起動させて前処理を行うということで大丈夫ですか?
「kokoro2_ch.txt」と頂いたファイルの違いは
行数
kokoro2_ch.txt・・108306行
頂いたファイル ・・107935行
最初の部分
・kokoro2_ch.txt
<H1>
<H1>
<H1>
タグ
上
ウエ
上
名詞-一般
_
_
_
記号-一般
先生
センセイ
先生
名詞-一般
と
ト
と
助詞-並立助詞
私
ワタシ
私
名詞-代名詞-一般
EOS
上
ウエ
上
名詞-一般
_
_
_
記号-一般
先生
センセイ
先生
名詞-一般
と
ト
と
助詞-並立助詞
私
ワタシ
私
名詞-代名詞-一般
・頂いたファイル
<H1>
<H1>
<H1>
タグ
上
ウエ
上
名詞-一般
_
_
_
記号-一般
先生
センセイ
先生
名詞-一般
と
ト
と
助詞-並立助詞
私
ワタシ
私
名詞-代名詞-一般
段落
・kokoro2_ch.txt
<H2>
<H2>
<H2>
タグ
七
ナナ
七
名詞-数
EOS
七
ナナ
七
名詞-数
</H2>
</H2>
</H2>
タグ
・頂いたファイル
<H2>
<H2>
<H2>
タグ
七
ナナ
七
名詞-数
</H2>
</H2>
</H2>
タグ
「kokoro2_mph.txt」と「kokoro2.txt」の違いはおそらくないと思います。