はじめまして、樋口です。書き込みありがとうございます。
少し内容が異なるものですが、以前に辞書としてUniDICを使えないかというご
相談がありました。手順としてはかなり面倒ですが、(ライセンス上の問題を
クリアしていればですが)UniDICは使用可能でした。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=525&mode=allread
おおむね似たような手順で、NAIST Japanese Dictionary(NAIST-jdic)も利
用できるのではないかと思います。Web上のドキュメントを簡単に見た限りで
は、IPADICとNAIST-jdicは品詞体系が同じのようです。よって、KH Coder側で
品詞体系を設定し直す必要がない分、NAIST-jdicの方が楽かもしれません。実
際に試していないのですが、KH Coderに同梱の茶筌を「naist-jdic with "Cha
Sen for Windows"」で置き換えれば、それだけで良さそうに見えます。
ただし、いかに辞書が新しくなっても、分野固有の用語や専門用語などは、自
分で追加せざるを得ない場合が多いかとは思います。その点で、形態素解析器
の辞書更新を試みるよりも、KH Coderの強制抽出機能をひとまずお使いいただ
く方が、費用対効果が良いかもしれません。メニューから「前処理」→「語の
取捨選択」です。
それではよろしくお願いいたします。
p.s.
余談になりますが、KH Coderでは分析結果が変わるのを避けるために、かなり
古いバージョンの茶筌・IPADICをあえて使い続けております。
しかし、無論「昔のバージョンと分析結果が変わっても、新しい形態素解析器
や辞書を使いたい」というご要望もあろうかと思います。そこで、KH Coderの
次のバージョンでは、茶筌とMeCabを切り替えてご使用いただけるようにする予
定です。
# NAIST-jdicもMeCab版の方が新しいものが出ているようですね。ただ、
# Windows上でのインストール方法がちょっとWebを見た限りでは分かり
# ませんでしたが…。
次期KH Coderでは、同梱の茶筌を選べば昔のバージョンと同じ分析結果が得ら
れる一方、MeCabを選んだり、辞書を手動で更新すれば、新しい形態素解析器・
辞書をお使いいただけるようになります。
なお、あまりお勧めするわけではないのですが、もしも、今すぐMeCabをお使
いになりたいという強いご希望がおありでしたら、開発途上版をお試しいただ
くことも可能です。メニューから「プロジェクト」「設定」で切り替え可能です。
MeCabは別途ご準備いただく必要があります。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=748&reno=747&oya=747&mode=msgview