Re: 「強制抽出」機能の扱いについて (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1297] Re: 「強制抽出」機能の扱いについて 投稿者:HIGUCHI Koichi  投稿日:2013/03/13(Wed) 15:12:59

こんにちは、樋口です。書き込みありがとうございます。

お書きいただいているように、まずは「強制抽出」機能を使って「タグ」品詞
として取り出すの方法をお試しいただくのが良いかと思います。ただ、こうし
た場合には、この機能の扱いには少し注意が必要です。

たとえばデータ中に「(^_^)/~」があり、「強制抽出」欄では以下のように指
定したとします。

> ^_^
> (^_^)/~

この場合は、データ中の「(^_^)/~」が、「(」「^_^」「)」「/」「~」といっ
た語に分割されると思います。「(^_^)/~」よりも上で指定した「^_^」が優先
され、「^_^」が先に取り出されるためです。

したがって「強制抽出」機能を使用する場合には、より長い顔文字から先に指
定する必要があるでしょう。


もちろん、KH Coderによる「強制抽出」ではなく、茶筌の辞書を編集して「顔
文字」品詞として取り出す方法も有効でしょう。この場合にはまず茶筌のマニ
ュアルにあたり、茶筌が顔文字を1語(顔文字品詞)として抽出してくれるよ
う設定してください。その上で、KH Coder側の品詞体系を編集して、顔文字品
詞を分析対象にすると良いでしょう。

KH Coderの品詞体系についてはこちらのページのほか、マニュアルの2.2.2節
がご参考になるかもしれません。
http://khc.sourceforge.net/FAQ.html#hinshi


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)