[掲示板へもどる]
一括表示

  [No.706] 共起ネットワークの一部文字化け 投稿者:nezima  投稿日:2011/01/02(Sun) 13:21:22

はじめまして。
KH Coderを便利に使わせていただいています。

共起ネットワーク図の中に、「落Z」と、一部(一箇所)だけ文字化けが出ます。元データの中には、「落Z」はもとより「落」がつく語もありません。Windowsを使っています。

文字化けの原因や直し方がおわかりになれば、教えていただけないでしょうか。


  [No.707] Re: 共起ネットワークの一部文字化け 投稿者:HIGUCHI Koichi  投稿日:2011/01/02(Sun) 14:17:07

こんにちは、樋口です。書き込みありがとうございます。

一部の文字化けというのは少し手強そうですね。そのネットワークが表示され
た状態で「保存」をクリックして、「R Source」形式で保存してください。

そして、保存したファイルを「秀丸」「メモ帳」等のテキストエディタで開き、
「colnames(d)」を検索して下さい。以下のような形の、語のリストがあるは
ずです。

colnames(d) <- c("先生","奥さん","自分","お嬢さん","言葉","手紙","叔父","人間","様子","心持","態度","話","意味","病気","卒業","返事","急","東京","問題","前","今","K","思う","見る","聞く","出る","帰る","来る","考える","知る","行く","立つ","答える","死ぬ","見える","知れる","書く","解る","出す","話す","取る","坐る","付く","笑う","歩く","読む","好い","悪い","少し","父","人","母","顔","眼","心","妻","口","女","頭","手","事","宅","家","室","男","気","兄","声","外")

まずは、ここで既に文字化けしているのか、それとも、この時点では大丈夫な
のか。また、どの語が「落Z」に文字化けしているのかといったことを調べて
みていただけますでしょうか。こうしたことが分かると、解決に向けての手が
かりとして役立つかも知れません。


  [No.708] Re: 共起ネットワークの一部文字化け 投稿者:nezima  投稿日:2011/01/02(Sun) 15:04:21

樋口さま

早速のご返信をありがとうございます。

「colnames(d)」を検索して、語彙のリストを見てみました。
この時点では、文字化けはありませんでした。

ですが、その語彙リストの中には、共起ネットワーク図内に見当たらない語が複数(10以上)あり、どれが「落Z」に文字化けしているのかは、わかりませんでした。

共起ネットワーク図を描くときの設定としては、
・Jaccard係数0.2以上
・最小出現数5

等の設定をしています。そういったことも関係があるのでしょうか。


  [No.709] Re: 共起ネットワークの一部文字化け 投稿者:HIGUCHI Koichi  投稿日:2011/01/02(Sun) 15:16:16

こんにちは、樋口です。書き込みありがとうございます。

「kh_coder.exe」と同じ場所に「Rgui.bat」というファイルがあります。これ
をダブルクリックするとKH Coderに付属のRが起動します。「R Console」とい
う部分(ライセンスの説明が出ている部分)に、KH Coderから保存したR Sour
ceファイルをドラッグ&ドロップしてみてください。おそらく、KH Coder上で
表示されたのと同じ共起ネットワークが得られると思います。

次にR Sourceファイルをテキストエディタで開き、「colnames(d) <- c("先生
"(後略)」の部分のダブルクォート「"」を、すべてシングルクォート「'」
に置き換えて、上書き保存します。

その上でもう一度R Sourceファイルを「R Console」部分にドラッグ&ドロッ
プしてみてください。これで文字化けが直ったりしないでしょうか? もしこ
れで直れば、ネットワーク上で右クリックして「メタファイルにコピー」をク
リックすれば、Word等にネットワークを貼り付けることができます。


  [No.710] Re: 共起ネットワークの一部文字化け 投稿者:nezima  投稿日:2011/01/02(Sun) 15:40:07

何度もお手数をおかけして、すみません。

指示いただいたとおりにやってみましたが、同じ文字化け(「落Z」)が残ります。


  [No.711] Re: 共起ネットワークの一部文字化け 投稿者:nezima  投稿日:2011/01/02(Sun) 16:39:54

Re: 共起ネットワークの一部文字化け (画像サイズ: 605×395 57kB)

色々してみたところ、「落Z」に文字化けしているのが「予算」だ、ということがわかりました。
それから、私のパソコンは、基本的にフランス語環境になっています。(R Guiのインターフェイスもフランス語でした)それが何か関係があるのでしょうか?

R Guiのインターフェイスを英語にしてみたところ、文字化けについて(だと思います)次のようなエラーメッセージが出ています。

--------------------------------------------
Warning messages:
1: '\・ is an unrecognized escape in a character string
2: unrecognized escape removed from "予算"
--------------------------------------------

この掲示板に貼り付けると、上のように表示されましたが、
'\・のところおよび"予算"のところは、実際にはR Gui上では
添付ファイルのようになっています。


  [No.712] Re: 共起ネットワークの一部文字化け 投稿者:HIGUCHI Koichi  投稿日:2011/01/02(Sun) 23:46:13

こんにちは、樋口です。書き込みありがとうございます。

先程書きました対策が空振りだったようで恐縮です。

> 私のパソコンは、基本的にフランス語環境

これは少し関係があるかもしれません。考えられる対策としては以下の2つが
あります。

[1] R SourceファイルをRにドラッグ&ドロップすると、
> source("ファイル名")
というコマンドが実行されます。ここでキーボードの「↑」キーを押すと、再
びこのコマンドがあらわれて、コマンドを編集できます。コマンドを以下のよ
うに編集して、エンターキーを押してみて下さい。
> source("ファイル名", encoding="CP932")
「, encoding="CP932"」を追加するのが変更点です。先頭の「>」は、ただの
飾り(?)ですので、追加しないで下さい。

[2] 上の方法でダメだった場合、R Sourceファイルの文字コードをUTF-8に変
えてみるというのも一手かと思われます。秀丸の場合、「名前を付けて保存」
ダイアログで文字コードを設定できます。UTF-8で保存したファイルをRにドラ
ッグ&ドロップしてみるといかがでしょうか。


  [No.713] Re: 共起ネットワークの一部文字化け 投稿者:HIGUCHI Koichi  投稿日:2011/01/03(Mon) 03:39:13

樋口です。考えられる対策をもう1つ思いつきました。

[3] Rgui.batをダブルクリックしてRを起動したら、まず以下のコマンドを実
行します。(最初の「>」を含めずに、それ以後をR Consoleに入力してキーボ
ードのEnterキーを押します)
> Sys.setlocale(category="LC_ALL", locale="Japanese_Japan.932")
そして、KH Coderから保存したR SourceファイルをR Consoleにドラッグ&ド
ロップします。

[1]から[3]までのどれかが効果を発揮すると良いのですが…。


  [No.714] Re: 共起ネットワークの一部文字化け 投稿者:nezima  投稿日:2011/01/03(Mon) 12:52:03

樋口さま

ご提示いただいた(1)〜(3)は、うまくいかなかったのですが、弟に、頂いたアドバイスを見せたところ、それを参考にして次のようなやり方で解決したようです。

1.まず、Rgui.batに下の2行を追加して英語化し,console上で日本語表示ができるようにしました。
-------------------
set LANG=C
set LC_ALL=C
-------------------

2.文字化けを起こすのは"予算"という単語の"予"の文字なので(例えば"予算"は"落z"に文字化けしましたが、"決算"に変えると大丈夫)、http://www.kis-lab.com/serikashiki/C/C08.html#Shift_JIS(Shift-JISの補足欄)を参考に.rファイルの内の"予算"→"予\算"と置き換え、
rguiで実行すると、グラフでも「予算」と描画する事ができました。

(sprintf("予算")では"落z", sprintf("予\算")では"予\算"なので、まだ弟は腑に落ちないといっていますが。)

新春早々、本当にお手数をおかけしました。
感謝いたします。


  [No.715] Re: 共起ネットワークの一部文字化け 投稿者:HIGUCHI Koichi  投稿日:2011/01/03(Mon) 13:24:04

樋口です。書き込みありがとうございます。
ひとまず解決とのこと、何よりです。

ただ、なんと言いますか、どうしてそうした症状になったのか未だに分からず、
また根本的な解決とも言い難く、どうにも腑に落ちないところではあります。
可能ならば原因解明と根本的な解決を目指したいところです。

そういうようなことで、気が向かれて、なおかつお時間のあるときにでも以下
をお教えいただけましたら幸いです。

■対策[3]の修正版

Rgui.batでRを起動した後、以下のコマンドを実行してみて下さい。
> Sys.setlocale(locale="Japanese")

上手く行けば以下のような内容が表示されると思います。表示されない場合は
タイプミスの可能性がありますのでご確認下さい。
> [1] "LC_COLLATE=Japanese_Japan.932;LC_CTYPE=Japanese_Japan.932;(後略)

その上で、.rファイルをドラッグ&ドロップするといかがでしょうか。もちろ
ん、"予\算"に直していない、"予算"のままの.rファイルです。

もしこれで上手く行くようでしたら、以下は不要です。

■英語化につきまして

>1.まず、Rgui.batに下の2行を追加して英語化(後略)
>-------------------
>set LANG=C
>set LC_ALL=C

これは必須でしたでしょうか? というのは、これを取り除いた状態でRを起
動しても、.rファイルの内の"予算"を"予\算"に置き換えてあれば、上手く行
くのでしょうか?

■Rのロケールの状態

R上で以下のコマンドを実行すると、どんな結果になりますでしょうか。
> Sys.getlocale()

■Windows環境について

Winowsは日本語版のものでしょうか? また「フランス語環境」というのは、
どのような設定でしょうか。おそらくはコントロールパネルの「地域と言語」
を編集されているのだと思うのですが、「形式」タブの上部の言語や、「管理
」タブの「Unicode対応でないプログラムの現在の言語」は何になっています
でしょうか?

※上記はWindows 7の場合の表記です。XPでは以下のように読み替えて下さい。
「地域と言語」→「地域と言語のオプション」
「形式」タブ→「地域オプション」タブ
「管理」タブ→「詳細設定タブ」


手元の環境で、問題の現象を再現することさえ出来ればなんとかなると思うの
ですが、今までのところ再現できずにおります。よろしかったら、お手すきの
折にでも上記をお教え下さい。


  [No.716] Re: 共起ネットワークの一部文字化け 投稿者:nezima  投稿日:2011/01/03(Mon) 15:29:26

樋口さま

> ■対策[3]の修正版
としてくださった方法で、うまくいきました。
すっきりした解のように感じます。

それから、遅まきながらWindows環境は以下の通りです。

-------------------------------
Windows Vista Home Basic SP2

「形式」タブの上部の言語
フランス語(フランス)
「Unicode対応でないプログラムの現在の言語」
日本語(日本)
-------------------------------

ありがとうございました!


  [No.717] 外国語設定のWindowsでのプロット文字化け 投稿者:HIGUCHI Koichi  投稿日:2011/01/03(Mon) 16:55:47

樋口です。デバッグにお付き合いいただいてまことにありがとうございます。

対策[3]の修正版で上手く行ったようでしたら、以降はわざわざRを起動しなく
ても、以下の手順によって、KH Coder上で文字化けの無いプロットを作成して
いただけると思います。

まず以下のZipファイルをダウンロードして解凍します。そしてZip内に含まれ
ているファイル「z1_config_r_locale_windows.pm」を、「kh_coder.exe」と
同じ場所の「plugin」フォルダにコピーします。(この時点で既にKH Coderを
起動している場合は再起動して下さい)
http://khcoder.info/psnl/tmp/z1_config_r_locale_windows.zip

これによって、KH Coder上のプロットも文字化けしなくなるはずです。

KH Coderは多変量解析やプロット作成にRを用いています。今回の文字化けは、
Windowsの言語設定を自動的に読み取ることで、Rの言語設定も外国語になって
しまったために生じたものです。そこで、KH Coderの起動時にRの言語設定を
日本語に直すのが上のプラグインです。

デバッグにご協力いただきましたこと、重ねてお礼申し上げます。


  [No.718] Re: 外国語設定のWindowsでのプロット文字化け 投稿者:nezima  投稿日:2011/01/03(Mon) 22:15:42

樋口さま

いただいたファイルは指示通り解凍・コピーいたしました。
また何かありましたら、ご相談させてください。

迅速かつ丁寧なご説明・ご対応をいただきましたこと、重ねて感謝申し上げます。


  [No.719] ゴミ // Re: 外国語設定のWindowsでのプロット文字化け 投稿者:HIGUCHI Koichi  投稿日:2011/01/03(Mon) 22:33:03

こんにちは、樋口です。書き込みありがとうございます。

> (前略)ファイルは指示通り解凍・コピーいたしました。

せっかくそこまでしていただけたのでしたら、KH Coder上で作成した共起ネッ
トワークが相変わらず文字化けするのか、それとも文字化けしなくなったのか
をお知らせいただけると本当にありがたいのですが、いかがでしょう。

# 駄目だったので書きにくいとお思いかもしれませんが、駄目なら駄目で、別
# の対策を考えるか、あるいは断念するか検討させていただきますので、ご一
# 考いただけましたら幸いです。