樋口先生
現在、江戸期の医学系文章のテキストマイニングをしております。
特に複合語が多く、現在とは違う送り仮名の使い方であるため、強制的に抽出する語を外部ファイルにて設定しました。
また、古文ですので、語の抽出にはMeCabを使用しました。
茶筅で語の抽出を行うと、抽出語の重複カウントはされないのですが、MeCabで行うと、語の強制抽出を行わないときには問題ないのですが、強制抽出させると重複して出現頻度をカウントされます。
何か回避する方はありますでしょうか?
使用環境は、MacOS 10.10.4で、KH Coder 2.beta.32です。