Re: 試してみました。 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.755] Re: 試してみました。 投稿者:HIGUCHI Koichi  投稿日:2011/04/07(Thu) 09:55:28

こんにちは、樋口です。書き込みありがとうございます。

現状で、ChaSen-2.4.2-1-NAIST-jdic-sijis-0.3.0」が動いている状態ですね。
jdicを使うという当初の目的はこれで達成されていると思います。私も試して
見ましたが、抽出語リストを見ると、固有名詞などが少し多めに抽出されるよ
うです。
# XPではエラーが出ませんでしたが、7ではお書きいただいたエラーが出ますね。
# 動作としては、今見ている限り特段の問題は無いようです。

茶筌向けのjdic 0.4.3(2008-07-07)も公開されていますが、辞書を使える状
態に変換(コンパイル)するためのスクリプト「makefile.bat」がエラーにな
るようです。よって現時点では、Windows上でこれを使うことはできないかと思
います。


ちなみにMecabを使うと、ChasenではなくMecabによって語を抽出(形態素解析)
するようになります。ChasenよりもMecabの方がやや新しく、使える辞書もやや
新しいというところでしょうか。(ただしMecab用jdicも、Windows上でコンパ
イルできるかどうかは不明です)

個人的には、テキストマイニングにおける利用では、分析結果は実用上さほど
変わらないのではないかと思っています。

しかし、KH Coderを使う以前からMecabを使い込んでおられて、Mecabの辞書を
ご自身で編集されているというような場合や、例えごくわずかな変化であって
も精度を追求したいという場合には、Mecabをお使いいただくと良いかもしれま
せん。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)