Re: 複合語は強制抽出することで分析に使用できるようになります (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.3762] Re: 複合語は強制抽出することで分析に使用できるようになります 投稿者:HIGUCHI Koichi  投稿日:2018/07/28(Sat) 01:36:51

こんにちは、樋口です。書き込みありがとうございます。

■TermExtractと茶筌の違い

どちらも基本的には、「名詞が2つ連続して出現していたら、その2つをくっつ
けて複合語にする」というような方式です。

TermExtractについて詳しくは、TermExtractのページをご覧ください。
http://gensen.dl.itc.u-tokyo.ac.jp/

■KH Coderにおける「複合語の検出」コマンドの使い方

「複合語の検出」コマンドは、「この言葉は複合語として抽出してはどうです
か?」という提案にすぎません。

したがって「複合語の検出」コマンドを実行しただけでは、抽出語リスト(品
詞別に分類されたエクセルの結果)に複合語は出てきませんし、ほかの分析に
も複合語は使えません。

提案を受け入れて、実際に複合語として取り出すためには、(1) 「語の取捨選
択」コマンドで、「強制抽出する語の指定」欄にその言葉を入力して「OK」を
クリックし、(2) 再度「前処理の実行」をする必要があります。

これを行なえば、抽出語リストには「タグ」という品詞名で複合語があらわれ
ます。また共起ネットワークなどでも複合語を利用可能です。共起ネットワー
クなどで、10回以上出現している語を使う場合、複合語が10回未満しか出現し
ていなければ切り捨てられます。この扱いは、他の語とまったく同じです。

※これらの点についてはマニュアルのA.4.4節に記載があるかと思います。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)