こんにちは、樋口です。
書き込みありがとうございます。
こちらの環境ではうまく問題を再現できずにおります。漱石「こころ」データ
でも問題を再現できるような、強制抽出する語の例であったり、あるいは問題
を再現できるデータをお送りいただくことは可能でしょうか。後者の場合、問
題を再現できる最小限のデータで結構です。
それと、わざわざMeCabをお使いということは、何か特別な辞書をお使いとい
うことでしょうか。
それから、重複して抽出というのは、「抽出語リスト」を見たときに出現回数
が実際より多いということでしょうか。この場合、KWICコンコーダンスや文書
表示画面では、たとえば、
> それからその 卒業証書 卒業証書 を机の上に放り出した。
のように、強制抽出した語(卒業証書)が2連続で表示されていたりしますで
しょうか。あるいは、それ以外の形の重複でしょうか。
どうぞよろしくお願いいたします。