樋口先生こんばんは。 早速のご返信ありがとうございます。
1度Snowball stemmerで試してみると、何と当初の問題解決しました!"by", "the"など余計なものも混ざっていますが、その点はStopwordsを登録すれば取り除けるかと思います。ありがとうございました!
ご指摘の点についてですが、visitの名詞と動詞のKWICに関して、間違っているものもありましたが、9割ほどは分類としては正解ですので両方の用法は確実にデータに含まれています。ですので、ご指摘の通りFreeLingが起動できても難しかったかもしれません。
CPUの件ですが、現在学校のパソコン(Windows)で起動しておりましてタスクマネージャーがAdminによって無効化されて確認不可能でした(泣)
しかし、一旦Snowball Stemmerで当初の問題は解決できたのでこのまま分析を進めて行こうと思います。重ね重ねサポートありがとうございました。
|