樋口先生!mecabより茶筅の方が早い気がするのですが何か設定やダウンロードをしないといけないとかありますでしょうか?
こんにちは、樋口です。書き込みありがとうございます。いえ、そういうものです。MeCabは機能が絞り込まれているので、茶筌にあるけれどMeCabにない機能をKH Coder側でカバーするため、MeCab利用時は処理に時間がかかります。
やっぱりそうだったんですか・・・更新履歴でいえば、mecabの方が新しいので、最近の言葉とかは、盛り込まれてるので使用するにはmecabの方がよいですよね?
こんにちは、樋口です。書き込みありがとうございます。添付のIPADicを使う場合、どちらでもそれほど大差ないと思います。ただ、MeCab用にしか公開されていない辞書を使いたい場合にはMeCabを使うしかないですね。例えば、UniDic、近代文語UniDic、中古和文UniDic等です。
わかりました。一度やってみようと思います。ちなみに解析したい文字数が多くなるとその分、解析する時間なども多くなると思いますが、短くする方法とかありませんか?
ランダムサンプリングによってデータ量を減らすくらいしか方法はないと思います。http://khc.sourceforge.net/FAQ.html#d-size-timeあるいは、KH Coderのソースコードを編集して、処理を効率化していただくくらいかと。