[掲示板へもどる]
一括表示

  [No.668] 共起ネットワークの単語が文字化け 投稿者:nncoder  投稿日:2010/11/01(Mon) 12:11:50

樋口先生、度々お世話になります。

無事Linuxでの稼働が確認されWindowsで実行していたものを再現している最中なのですが、
共起ネットワークで抽出した単語が全て「・・・・」のような文字化けを起こしています。

igraph
RColorBrewer

上記2つをRから直接インストールして起動にはこぎつけたものの、文字コードの問題でしょうか、ぶつかっております。

ご指導賜りたくお願いいたします。


  [No.669] LinuxにおけるRの設定 投稿者:HIGUCHI Koichi  投稿日:2010/11/01(Mon) 17:37:38

こんにちは、樋口です。書き込みありがとうございます。

お使いのLinux環境では、Rによる日本語文字列のプロットがそもそも可能な状
態になっていますでしょうか。Rを単独で起動し、この点を確認していただく
ことがまずは先決かと思われます。
※Rを単独で起動するには、ターミナルで「R」と入力してエンター・キーを押
して下さい。コマンドとして「plot(0,0,xlab="日本語テスト")」のように入
力してエンターを押せば、プロットエリアに日本語を表示できるかどうか分か
るでしょう。

その上で、共起ネットワークを「R Source」形式で保存し、そのファイルをR
(単独で起動したR)で実行してみると良いと思います。
「source("ファイル名")」というコマンドをRに入力すれば、ファイルをRで実
行できます。
http://khc.sourceforge.net/scr_r.html#using_plots

(a) この結果文字化けしないようなら、KH CoderによるRの使い方に問題があ
るということになります。この場合はその旨お知らせいただければ対応策をま
た考えます。

一方で、(b)相変わらず文字化けするようでしたら、保存した「R Source」形
式ファイルの文字コードをUTF-8などに変えたうえで、R上で実行してみてくだ
さい。これでもし上手くいくようでしたら、KH Coderを起動する前に当該の
ターミナルのロケールをja_JP.EUC-JPに設定していただくと、KH Coder上でも
上手くいくかもしれません。

p.s.
WindowsとLinuxとで、ChaSen / IPADICのバージョンが違う場合、分析結果も
微妙に異なるものになると思います。


  [No.670] Re: LinuxにおけるRの設定 投稿者:nncoder  投稿日:2010/11/02(Tue) 10:51:19

ご回答ありがとうございます。

頂いた情報を元に試してみました。
環境の文字コードの問題でした。当初utf8で動かしていたために文字化けした模様です。
結果として、euc環境では文字化けなく共起ネットワークの出力に成功しています。

元々utf8環境でKH Coderを起動したために発生していた模様で、exportで文字コードをeucに変更してから起動し、共起ネットワークを実行した際は文字化けしておりません(当然ながらターミナルロケールもeucへ)

Rも同様にeuc環境では文字化けせず動いております。

ありがとうございました。
今後は、KH Coder利用の際には文字コードの確認を行ってから使用いたします。

今後ともよろしくお願いいたします。