Re: 強制抽出語を設定すると重複して抽出される (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1932] Re: 強制抽出語を設定すると重複して抽出される 投稿者:HIGUCHI Koichi  投稿日:2015/01/10(Sat) 19:54:49

こんにちは、樋口です。
書き込みありがとうございます。

こちらの環境ではうまく問題を再現できずにおります。漱石「こころ」データ
でも問題を再現できるような、強制抽出する語の例であったり、あるいは問題
を再現できるデータをお送りいただくことは可能でしょうか。後者の場合、問
題を再現できる最小限のデータで結構です。

それと、わざわざMeCabをお使いということは、何か特別な辞書をお使いとい
うことでしょうか。

それから、重複して抽出というのは、「抽出語リスト」を見たときに出現回数
が実際より多いということでしょうか。この場合、KWICコンコーダンスや文書
表示画面では、たとえば、

> それからその 卒業証書 卒業証書 を机の上に放り出した。

のように、強制抽出した語(卒業証書)が2連続で表示されていたりしますで
しょうか。あるいは、それ以外の形の重複でしょうか。

どうぞよろしくお願いいたします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)