[掲示板へもどる]
一括表示

  [No.3760] 複合語の検出に関しての質問 投稿者:MIA  投稿日:2018/07/27(Fri) 15:30:37

こんにちは。
お問い合わせします。
複合語の検出に関しての質問です。マニュアルを読みましたが、理解ができない部分があり、質問します。

■お使いのKH Coderのバージョン
3.Alpha.13c

■どんなエラー・不具合・問題ですか?

→複合語の検出にされる機能でTermExtractはKH Coderに入れたデータで使われた複合語をもとに
東京大学情報基盤センター図書館電子化部門・中川研究所が持ってる基本データを利用し連結が多い順、つまりよく使われる順で
分析されたものですか?

また、茶せんはただKH Coderに入れた資料からの頻度順の複合語だと理解すればいいでしょうか?

→複合語で検出されるものと品詞別に検索されるものとはどんな関係がありますか?
 品詞別に分類されたエクセルの結果ファイルに複合語が全部細かく分けてはいっていて
 複合語はその中からの検出されるだけで、頻度の数に影響はないのでしょうか?


■お使いのOS
→Windows 7


すみません、質問が複雑になりましたが、全体的な複合語に関する質問です。
本の資料からKH Coderを使って品詞別に語彙を分類する作業をしており、このような機能が必要で質問します。


  [No.3761] Re: 複合語の検出に関しての質問 投稿者:MIA  投稿日:2018/07/27(Fri) 17:46:26



また、語の取り捨て選択の機能を使ったら
複合語に影響があるのでしょうか?


  [No.3762] Re: 複合語は強制抽出することで分析に使用できるようになります 投稿者:HIGUCHI Koichi  投稿日:2018/07/28(Sat) 01:36:51

こんにちは、樋口です。書き込みありがとうございます。

■TermExtractと茶筌の違い

どちらも基本的には、「名詞が2つ連続して出現していたら、その2つをくっつ
けて複合語にする」というような方式です。

TermExtractについて詳しくは、TermExtractのページをご覧ください。
http://gensen.dl.itc.u-tokyo.ac.jp/

■KH Coderにおける「複合語の検出」コマンドの使い方

「複合語の検出」コマンドは、「この言葉は複合語として抽出してはどうです
か?」という提案にすぎません。

したがって「複合語の検出」コマンドを実行しただけでは、抽出語リスト(品
詞別に分類されたエクセルの結果)に複合語は出てきませんし、ほかの分析に
も複合語は使えません。

提案を受け入れて、実際に複合語として取り出すためには、(1) 「語の取捨選
択」コマンドで、「強制抽出する語の指定」欄にその言葉を入力して「OK」を
クリックし、(2) 再度「前処理の実行」をする必要があります。

これを行なえば、抽出語リストには「タグ」という品詞名で複合語があらわれ
ます。また共起ネットワークなどでも複合語を利用可能です。共起ネットワー
クなどで、10回以上出現している語を使う場合、複合語が10回未満しか出現し
ていなければ切り捨てられます。この扱いは、他の語とまったく同じです。

※これらの点についてはマニュアルのA.4.4節に記載があるかと思います。