[掲示板へもどる]
一括表示

  [No.1679] mecabと茶筅 速さ 投稿者:メカブおいしい  投稿日:2014/05/28(Wed) 14:56:29


樋口先生!

mecabより茶筅の方が早い気がするのですが何か設定やダウンロードを
しないといけないとかありますでしょうか?


  [No.1680] Re: MeCabと茶筌使用時の処理速度 投稿者:HIGUCHI Koichi  投稿日:2014/05/28(Wed) 15:03:35

こんにちは、樋口です。書き込みありがとうございます。

いえ、そういうものです。

MeCabは機能が絞り込まれているので、茶筌にあるけれどMeCabにない機能
をKH Coder側でカバーするため、MeCab利用時は処理に時間がかかります。


  [No.1681] Re: MeCabと茶筌使用時の処理速度 投稿者:メカブおいしい  投稿日:2014/05/28(Wed) 15:09:53

やっぱりそうだったんですか・・・

更新履歴でいえば、mecabの方が新しいので、最近の言葉とかは、盛り込まれてるので
使用するにはmecabの方がよいですよね?


  [No.1682] Re: MeCabと茶筌 投稿者:HIGUCHI Koichi  投稿日:2014/05/28(Wed) 15:13:14

こんにちは、樋口です。書き込みありがとうございます。

添付のIPADicを使う場合、どちらでもそれほど大差ないと思います。

ただ、MeCab用にしか公開されていない辞書を使いたい場合にはMeCab
を使うしかないですね。例えば、UniDic、近代文語UniDic、中古和文
UniDic等です。


  [No.1683] Re: MeCabと茶筌 投稿者:メカブおいしい  投稿日:2014/05/28(Wed) 16:58:59

わかりました。一度やってみようと思います。

ちなみに解析したい文字数が多くなるとその分、解析する時間なども
多くなると思いますが、短くする方法とかありませんか?


  [No.1684] Re: データが大きい場合 投稿者:HIGUCHI Koichi  投稿日:2014/05/28(Wed) 17:18:01

ランダムサンプリングによってデータ量を減らすくらいしか方法はない
と思います。
http://khc.sourceforge.net/FAQ.html#d-size-time

あるいは、KH Coderのソースコードを編集して、処理を効率化していた
だくくらいかと。