Re: 強制抽出語を設定すると重複して抽出される (Kirisako) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1931] 強制抽出語を設定すると重複して抽出される 投稿者:   投稿日:2015/01/10(Sat) 12:53:40

樋口先生
現在、江戸期の医学系文章のテキストマイニングをしております。
特に複合語が多く、現在とは違う送り仮名の使い方であるため、強制的に抽出する語を外部ファイルにて設定しました。
また、古文ですので、語の抽出にはMeCabを使用しました。
茶筅で語の抽出を行うと、抽出語の重複カウントはされないのですが、MeCabで行うと、語の強制抽出を行わないときには問題ないのですが、強制抽出させると重複して出現頻度をカウントされます。
何か回避する方はありますでしょうか?

使用環境は、MacOS 10.10.4で、KH Coder 2.beta.32です。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)