Re: 複数の品詞に群類される語の取り扱い (鈴木　卓) KH Coder 旧掲示板

早速のお返事と解決策のご提案、誠に有り難うございます。

実は、問題は、コンコーダンスで確認しますと、所謂「川崎」や「豊田」など地名の場合、形態素解析エンジンによる「組織名」への分類が「助詞や格助詞、あるいは句読点の『、』が付くと組織名」など、それは大雑把な振り分けをする用ですので、言語学的に不適切なものが多いため、解析結果の信頼性が低下するという点。例えば、「川崎・豊田」のかわりに「川崎、豊田」とありますと組織名に分類されるケースが起こりえます。

これは仰る通り手作業で一つ一つ当たるか、辞書から組織名の方を削除、さもなくば語の後に全角スペースを挿入、組織名の該当する分は複合語を検出し該当するものを強制抽出リストに加えて解析するというような手段になりそうです。

ご指導有り難うございました。