こんにちは、樋口です。書き込みありがとうございます。
いくぶん繰返しになるのですが、TermExtractが出力する「専門用語」には、
(1)茶筌が抽出した単独の形態素と、(2)複数の形態素を連結した複合語との、
両方が含まれています。
KH Coderでは、これらのうち(1)単独の形態素をすべて無視して、(2)複合語だ
けを表示しています。つまり、TermExtractの出力の一部だけを表示している
点で、言わばTermExtractの出力を編集しています。
それ以外の変更は行っていません。
> 通常、茶筅をかけた後にtermextractを動かしたものと、khcoderで動かした
> 結果が少々異なります。
茶筌のバージョンによって、多少出力が変わるということはあるかもしれませ
ん。KH Coderに添付の茶筌をお試しになれば、もしかすると結果が一致するか
もしれません。
KH Coderに添付の茶筌は、kh_coder.exeのあるフォルダから見てdep\chasen\
chasen.exeにあります。