Re: 形態素解析時の判定順 [11/24修正] (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1191] Re: 形態素解析時の判定順 [11/24修正] 投稿者:HIGUCHI Koichi  投稿日:2012/11/22(Thu) 13:57:08

こんにちは、樋口です。書き込みありがとうございます。


茶筌による形態素解析の段階で調整を行う方法については、「複合語」「複合
名詞」といったキーワードに注意しつつ、茶筌のマニュアルをご覧下さい。
Windows版でしたらdep\chasen\docフォルダに同梱しています。

違う種類の形態素の中でどれを採用するかという優先度については、辞書内の
各形態素のコスト値を編集することで、変更できるでしょう。


※ただ、辞書の編集はそれなりに複雑で大変な作業ですし、茶筌に複合語を出
力させると、かなり長い複合語も出力されます。例えば「第二子」といった抽
出だけでなく「第二子山田太郎元首相当選可能性」といった抽出もありえます。

このあたりの兼ね合いもあって、「複合語の検出」コマンドの利用がやはりお
勧めではあります。「複合語の検出」コマンドで出力されるリストの中で、ス
コアや頻度の高いものを「強制抽出」欄に貼り付けるという形でしたら、さし
て作業量はないかと思います。また品詞につきましては、複合語は基本的に名
詞ですから、「タグ」=「複合名詞」とお考えいただくと良いでしょう。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)