[掲示板へもどる]
一括表示

  [No.1079] 茶筅とMeacbとの抽出語の品詞の差異 投稿者:袋井  投稿日:2012/09/09(Sun) 14:07:46

樋口先生さま

お世話になります、袋井と申します。

細かい話で恐縮ですが、
茶筅とMeacbとの抽出語の品詞の差異について、教えていただきたいことがございます。


まず私は「未知語」を解消することを考えます。
※茶筅の辞書登録をすることもありますが、KH coderでは強制抽出語を活用して複合名詞を抽出することが多いです。


私の手持ちのデータでやる限りですが、
「抽出語」「抽出語リスト」の「品詞別」で出力した結果を比較すると、Mecabでは「未知語」が見当たりません。


そもそも、Mecabでは「未知語」という品詞区分はないのでしょうか?

Kh coderで、名詞、名詞B、名詞Cなどに振り分けているのでしょうか?


よろしくお願いします。


  [No.1082] Re: 茶筅とMecabの品詞の違い 投稿者:HIGUCHI Koichi  投稿日:2012/09/11(Tue) 14:23:58

こんにちは、樋口です。書き込みありがとうございます。

Mecab側で、「名詞-一般」等の品詞名を付与しているようです。「未知語」が
あったときにも、字種などの情報をもとに、「未知語」以外の品詞名をMecab
が与えています。また、この設定は変更できるようです。

Windows上で同じように行えるかどうか分かりませんが、こちらのページが比
較的分かりやすかったです。
http://blog.mwsoft.jp/article/40647298.html

もちろん、公式のマニュアルもご参考になろうかと存じます。
http://mecab.googlecode.com/svn/trunk/mecab/doc/learn.html


  [No.1083] Re: 茶筅とMecabの品詞の違い 投稿者:袋井  投稿日:2012/09/11(Tue) 19:47:18

樋口先生さま

お世話になります、袋井と申します。

理解できました。

役に立つ情報源も教えていただき、助かりました。
さっそく勉強させていただきます。

ありがとうございました。