mecabと茶筅　速さ [スレッド] KH Coder 旧掲示板

樋口先生！

mecabより茶筅の方が早い気がするのですが何か設定やダウンロードを
しないといけないとかありますでしょうか？

■ [No.1680] Re: MeCabと茶筌使用時の処理速度 投稿者：HIGUCHI Koichi 投稿日:2014/05/28(Wed) 15:03:35

こんにちは、樋口です。書き込みありがとうございます。

いえ、そういうものです。

MeCabは機能が絞り込まれているので、茶筌にあるけれどMeCabにない機能
をKH Coder側でカバーするため、MeCab利用時は処理に時間がかかります。

■ [No.1681] Re: MeCabと茶筌使用時の処理速度 投稿者：メカブおいしい 投稿日:2014/05/28(Wed) 15:09:53

やっぱりそうだったんですか・・・

更新履歴でいえば、mecabの方が新しいので、最近の言葉とかは、盛り込まれてるので
使用するにはmecabの方がよいですよね？

■ [No.1682] Re: MeCabと茶筌 投稿者：HIGUCHI Koichi 投稿日:2014/05/28(Wed) 15:13:14

こんにちは、樋口です。書き込みありがとうございます。

添付のIPADicを使う場合、どちらでもそれほど大差ないと思います。

ただ、MeCab用にしか公開されていない辞書を使いたい場合にはMeCab
を使うしかないですね。例えば、UniDic、近代文語UniDic、中古和文
UniDic等です。

■ [No.1683] Re: MeCabと茶筌 投稿者：メカブおいしい 投稿日:2014/05/28(Wed) 16:58:59

わかりました。一度やってみようと思います。

ちなみに解析したい文字数が多くなるとその分、解析する時間なども
多くなると思いますが、短くする方法とかありませんか？

■ [No.1684] Re: データが大きい場合 投稿者：HIGUCHI Koichi 投稿日:2014/05/28(Wed) 17:18:01

ランダムサンプリングによってデータ量を減らすくらいしか方法はない
と思います。
http://khc.sourceforge.net/FAQ.html#d-size-time

あるいは、KH Coderのソースコードを編集して、処理を効率化していた
だくくらいかと。