こんにちは、樋口です。書き込みありがとうございます。
■TermExtractと茶筌の違い
どちらも基本的には、「名詞が2つ連続して出現していたら、その2つをくっつ
けて複合語にする」というような方式です。
TermExtractについて詳しくは、TermExtractのページをご覧ください。
http://gensen.dl.itc.u-tokyo.ac.jp/
■KH Coderにおける「複合語の検出」コマンドの使い方
「複合語の検出」コマンドは、「この言葉は複合語として抽出してはどうです
か?」という提案にすぎません。
したがって「複合語の検出」コマンドを実行しただけでは、抽出語リスト(品
詞別に分類されたエクセルの結果)に複合語は出てきませんし、ほかの分析に
も複合語は使えません。
提案を受け入れて、実際に複合語として取り出すためには、(1) 「語の取捨選
択」コマンドで、「強制抽出する語の指定」欄にその言葉を入力して「OK」を
クリックし、(2) 再度「前処理の実行」をする必要があります。
これを行なえば、抽出語リストには「タグ」という品詞名で複合語があらわれ
ます。また共起ネットワークなどでも複合語を利用可能です。共起ネットワー
クなどで、10回以上出現している語を使う場合、複合語が10回未満しか出現し
ていなければ切り捨てられます。この扱いは、他の語とまったく同じです。
※これらの点についてはマニュアルのA.4.4節に記載があるかと思います。