Re: 試していないのですが (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.753] Re: 試していないのですが 投稿者:HIGUCHI Koichi  投稿日:2011/04/04(Mon) 18:02:05

はじめまして、樋口です。書き込みありがとうございます。

少し内容が異なるものですが、以前に辞書としてUniDICを使えないかというご
相談がありました。手順としてはかなり面倒ですが、(ライセンス上の問題を
クリアしていればですが)UniDICは使用可能でした。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=525&mode=allread

おおむね似たような手順で、NAIST Japanese Dictionary(NAIST-jdic)も利
用できるのではないかと思います。Web上のドキュメントを簡単に見た限りで
は、IPADICとNAIST-jdicは品詞体系が同じのようです。よって、KH Coder側で
品詞体系を設定し直す必要がない分、NAIST-jdicの方が楽かもしれません。実
際に試していないのですが、KH Coderに同梱の茶筌を「naist-jdic with "Cha
Sen for Windows"」で置き換えれば、それだけで良さそうに見えます。

ただし、いかに辞書が新しくなっても、分野固有の用語や専門用語などは、自
分で追加せざるを得ない場合が多いかとは思います。その点で、形態素解析器
の辞書更新を試みるよりも、KH Coderの強制抽出機能をひとまずお使いいただ
く方が、費用対効果が良いかもしれません。メニューから「前処理」→「語の
取捨選択」です。

それではよろしくお願いいたします。

p.s.
余談になりますが、KH Coderでは分析結果が変わるのを避けるために、かなり
古いバージョンの茶筌・IPADICをあえて使い続けております。

しかし、無論「昔のバージョンと分析結果が変わっても、新しい形態素解析器
や辞書を使いたい」というご要望もあろうかと思います。そこで、KH Coderの
次のバージョンでは、茶筌とMeCabを切り替えてご使用いただけるようにする予
定です。
# NAIST-jdicもMeCab版の方が新しいものが出ているようですね。ただ、
# Windows上でのインストール方法がちょっとWebを見た限りでは分かり
# ませんでしたが…。

次期KH Coderでは、同梱の茶筌を選べば昔のバージョンと同じ分析結果が得ら
れる一方、MeCabを選んだり、辞書を手動で更新すれば、新しい形態素解析器・
辞書をお使いいただけるようになります。

なお、あまりお勧めするわけではないのですが、もしも、今すぐMeCabをお使
いになりたいという強いご希望がおありでしたら、開発途上版をお試しいただ
くことも可能です。メニューから「プロジェクト」「設定」で切り替え可能です。
MeCabは別途ご準備いただく必要があります。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=748&reno=747&oya=747&mode=msgview


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)