[掲示板へもどる]
一括表示

  [No.3657] UTF-8,UTF-16への対応 投稿者:横溝治行  投稿日:2018/06/01(Fri) 16:16:00

■質問内容

 KH Coderでは、UTF-8やUTF-16は対応しているのでしょうか。
 もし未対応の場合は、対処方法を教えて頂ければ幸いです。

■お使いのKH Coderのバージョン
 3.Alpha.13e

■お使いのOS
 Windows 10


 


  [No.3658] Re: UTF-8,UTF-16への対応 投稿者:HIGUCHI Koichi  投稿日:2018/06/01(Fri) 22:45:46

こんにちは、樋口です。書き込みありがとうございます。

日本語のテキストを分析する場合、従来は、EUCという文字コードで定義された
文字だけにしていただくのが原則でした。未定義文字(文字化け)部分は、KH
Coderの「分析対象ファイルのチェック」コマンドで一括して削除することがで
きます。

あるいは「文錦クレンジング for KH Coder」を使えば、削除ではなく、おお
むね同義の文字に変換してくれます(変換できるものについては)。
http://www.screen.co.jp/as/products/monkin-main.html


次に現在では、EUCで定義されていないUnicode文字も、ある程度までそのまま
使用できるようになってきました。ただし、まだいくつか制限があります。詳
しくはこちらのページをご覧ください。
http://khcoder.net/versions.html#utf-8-a

※もしUTF-8についての記述のところへ飛ばなかった場合、
「日本語UTF-8の分析対象ファイル」でページ内を検索してみてください。

Windows版のRに関する制限は、今後、回避できそうな見込みがあるのですが、
いつになるかは不明瞭です。


  [No.3663] Re: UTF-8,UTF-16への対応 投稿者:横溝治行  投稿日:2018/06/02(Sat) 20:31:43

樋口先生

 早速の返答に感謝申し上げます。
 残っている制限も理解できました。
 その制限を受容できるかを判断して、今後の利用方法を決めてまいります。
 引き続き、宜しくお願い申し上げます。

 横溝治行