こんにちは、樋口です。書き込みありがとうございます。
一度に一歩ですが、着実に進んではいるようですね。
> xls形式でFreeLingの前処理ももちろん試してみましたが、
> なぜか前処理が終わりません。
Stanford POS Taggerよりも時間がかかるのは通常の現象です。異常ではあり
ません。
タスクマネージャーを起動して、CPU使用率を見てみると、どんな感じでしょ
う? 前処理開始によってCPU使用率がある程度(※1)上がり、その状態が続
くようなら正常です。CPU使用率が0付近のままになり、それでも処理が終わら
なかったら異常です。この場合は、コンソール画面を見せていただけると何か
分かるかもしれません。また、この事象が発生した場合、一度Windowsを再起
動してお試しいただくとよいかもしれません。
※1 仮に論理プロセッサ数が8のCPUであれば、100 ÷ 8 ≒ 12.5%程度まで
CPU使用率が上がれば正常です。
> 同じ単語が2度あらわれる当初の問題
もっとも、FreeLingにすれば必ずこれが解決するかどうかはなんとも言えない
ところではあります。抽出語リスト上でvisitを検索し、2種類(名詞と動詞)
をクリックするとそれぞれのKWICが出ますので、ご覧いただくといかがでしょ
う? Stanford POS Taggerが間違って2種類に分けてしまっているのでしょう
か? それとも実際に動詞と名詞があるのでしょうか? もし後者だとすると
FreeLingでも同じ結果になる恐れはあります。