[掲示板へもどる]
一括表示

  [No.807] 文字化け 投稿者:坂根  投稿日:2011/06/23(Thu) 09:53:20

はじめてご質問させていただきます。よろしくお願いします。

いま中国にいて、中国のパソコンを使っています。
KHCoderをダウンロードし、起動すると、メニューの「プロジェクト」「前処理」などはすべて正しく日本語表記されます。
しかし付属のkokoroはすべて漢字に文字化けされていました。

適当に日本語文書を作って、
「分析対象ファイルのチェックと修正」をすると、やはり下のような結果になってしまいます。
■分析対象ファイル内に以下の問題点が発見されました(要約表示):
 ・文字化けを含む行があります: 12行
 ・望ましくない半角記号が含まれている行があります: 42行
ここから「自動修正」しても、データは文字化けのままです。平仮名の部分が漢字やアルファベットになったりします。
 たとえば、
「長さ」⇒「長L」
「今でもさほど気にならないような顔をしてすましている」⇒「今でもさほど荬摔胜椁胜い瑜Δ暑をしてすましている」※数字の部分は、本当は難解な漢字です。

過去ログ(フランス語環境のパソコンで一部が文字化けする事例)を拝見し、z1 config r…をダウンロードして、pluginの中に入れてみましたが、状況は変わりません。

OSはXPで、コントロールパネルの「地域と言語」で、
「地域選択」は中国語、「言語」は日本語となっています。
 
どうすればいいでしょうか。
どうかご教授ください。

最後に、私は日本語教師ですが、このような素晴らしい分析ソフトを開発されたことに、心からの尊敬と御礼を申し上げます。


  [No.808] Re: 文字化け 投稿者:HIGUCHI Koichi  投稿日:2011/06/23(Thu) 12:01:07

こんにちは、樋口です。書き込みありがとうございます。

中国のパソコンとなりますと、KH Coderにとっては新しい環境かもしれません。
そのため、解決できるかどうか自信は無いのですが、付属のkokoroの文字化け
について、もう少し状況をお教えいただけますでしょうか。

「tutorial」フォルダの「kokoro2.txt」をダブルクリックして開くと文字化け
しているという状況でしょうか? あるいは、KH Coderにプロジェクトとして登
録して前処理を行ったけれど、抽出語リストあるいは抽出語検索やKWICKコンコー
ダンスの結果が文字化けしているという状況でしょうか?


  [No.809] Re: 文字化け 投稿者:坂根  投稿日:2011/06/23(Thu) 19:31:39

樋口先生。

さっそくのお返事、大変ありがとうございます。

「kokoro2.txt」をダブルクリックして開くと文字化け
しているという状況です。
「tutorial」ファイルに入っている文書すべてが、同じように、全部漢字になってしまっています。

よろしくお願いします。


  [No.810] Re: 文字化け 投稿者:HIGUCHI Koichi  投稿日:2011/06/24(Fri) 02:39:06

こんにちは、樋口です。書き込みありがとうございます。

> 「kokoro2.txt」をダブルクリックして開くと文字化け
> している

「kokoro2.txt」をダブルクリックしたときに開くのは、KH Coderではなく、
お使いのPCにインストールされているテキストエディタであろうと思います。
※日本語Windowsですとデフォルトでは「メモ帳」というテキストエディタが
起動します。

「kokoro2.txt」は日本語のデータ(SHIFT-JIS)であるにもかかわらず、テキ
ストエディタが中国語のデータと見なして表示を行っているために、文字化け
が発生しているものと考えられます。

サクラエディタ(フリー)や秀丸エディタ(シェア)のような、和製のテキス
トエディタをインストールしてお使いいただきますと、当該の文字化けは解決
する可能性が高いと思います。


  [No.811] Re: 文字化け 投稿者:坂根  投稿日:2011/06/24(Fri) 09:11:23

樋口先生

さっそく「サクラエディタ」をインストールしました。
文字を入力すると、半角カタカナになります。例えば、「あいうえお」と入れると、「、、、ヲ、ィ、ェ」と表示されます。漢字やカタカナを入力しても同様に、変なカタカナ、または記号がでます。アルファベットのみ通常に入力できます。

正しい日本語文章をサクラエディタにコピーすると、これは問題なくできました。文字化けしません。しかし、このコピー済みの文書を、KHcoderのファイルの中に入れたとたん、すべての文字が漢字になってしまいました。

なお、windows付属のテキストエディタは、正常に入力でき、また、KHcoderのファイルの中に入れても、正常のままです。文字化けしません。ただし、「分析対象ファイルのチェック」を実行すると、問題があると提示され、修正を実行すると、文字化けします(全部が漢字という文字化けではありません。一部の平仮名は正常のままです)。

サクラエディタとテキストエディタで反応が違うようです。

このような状況です。
やはり中国のパソコンでは、KHCoderを使うのは難しいでしょうか。これだけ高機能なソフトなので、諦められない気持ちも強いです。

よろしくお願いします。


  [No.812] Re: サクラエディタでkokoro2.txtを開くと 投稿者:HIGUCHI Koichi  投稿日:2011/06/24(Fri) 09:53:34

こんにちは、樋口です。書き込みありがとうございます。

サクラエディタで「kokoro2.txt」を開くと、ちゃんと日本語が表示されない
でしょうか? 「ファイルを開く」の画面で「文字コードセット」が「SJIS」
になっていることを確認して、「kokoro2.txt」を開いてみて下さい。

# もし文字化けがあるようなら、一度KH Coderをすべて削除して、再度解凍
# (Unzip)してお試し下さい。

ちゃんと日本語が表示されていれば、「kokoro2.txt」の内容は大丈夫という
ことになります。すなわち、ファイルの中身は文字化けなどしておらず、そち
らでデフォルトで起動しているテキストエディタの能力不足で、内容を正しく
表示できていないだけということになります。

それを確認できれば、KH Coderのチュートリアルに沿って「kokoro2.txt」を
分析してみていただくと良いでしょう。抽出語リスト・KWIC検索・対応分析あ
たりをお試しいただいて、文字化けが無いようであれば、KH Coderもきちんと
動いているということになります。


KH Coderがきちんと動くことが確認できたら、その後、データ入力の手順に移
られてはいかがでしょう。KH Coderが動かなければ、データ入力していただい
ても分析できないでしょうから。


  [No.813] Re: サクラエディタでkokoro2.txtを開くと 投稿者:坂根  投稿日:2011/06/24(Fri) 19:25:12

サクラエディタでkokoroを開くことができました!
ありがとうございます。
また、青空文庫からの他の日本語文書も開けました。KHcoderも作動します。

サクラエディタは、ダウンロード以外の文書を開くと文字化けしますので、ダウンロードした文書限定で、日本語分析をしていきたいと思います。

心よりお礼申し上げます。


  [No.814] Re: データ入力を行う場合には 投稿者:HIGUCHI Koichi  投稿日:2011/06/24(Fri) 22:17:12

こんにちは、樋口です。書き込みありがとうございます。

ダウンロードしたデータの分析は可能なご様子で良かったです。青空文庫等の
ダウンロード・データのみで問題なければ、これでいったん解決というところ
でしょうか。


もしご自身でデータ入力をなさりたい場合には、まずはWordなり、Windows付
属のテキストエディタなりで、日本語の文章を入力すると良いでしょう。それ
を、サクラエディタの新規ファイルに貼り付けて保存すれば、KH Coderで分析
できるのではないかと思います。「名前を付けて保存」画面では、「文字コー
ドセット」を「SJIS」に、改行コードを「CR+LF」に設定して下さい。

なお、お試しになる際には、いきなり長文を入力するのではなく、まずは短い
文章でテストしていただくのが良いでしょう。


  [No.815] Re: データ入力を行う場合には 投稿者:坂根  投稿日:2011/06/25(Sat) 10:13:31

できました!
ありがとうございます。
これで何でも分析することができます。
KHCordeを日本語教育研究に大いに活用させていただきます。
厚くお礼申し上げます。