樋口先生さま
お世話になります、袋井と申します。
毎々、マニアックな質問でご迷惑をお掛けしております。
今回は、KH Coderの機能の質問ではなく、
こういう場合には、KH Coderではどのように接近したらよいか、効果的かという(悩み相談的な)質問です。
私は今まで、名詞に着目した分析方法をしてきました。
その理由は、動詞を含むと、否定形や、ポジティブ・ネガティブの文意の扱いに苦慮することが多くあることから、
動詞を扱わないように逃げてきた、というのが本音かもしれません。
係り受けに加え、感性や文意を抽出する専門ソフトも幾つか手元にありますが、
まだまだ精度の面で問題があり、結果を鵜呑みにすることはとても危険です。
痛い経験を何度もしてきました。
(ソフトが悪いのではなく、分析にかけるテキストの質に大きな問題があることも事実です)
KH Coderでは豊富な機能が提供されていますので、これらをうまく活用することで、
否定形や、ポジティブ・ネガティブの文意を把握した分析ができるのではないかと思っております。
分析対象データとして、以下の3文を考えます。
値上げは納得できない
値上げは納得いかない
値上げについて納得いく説明がほしい
いずれも、「値上げ」にネガティブな意見ばかりです。
抽出語リストでは、以下のように出力されます。
・サ変名詞 ⇒値上げ、納得、説明
・動詞B ⇒いく、できる
・形容詞B ⇒ほしい
・否定助動詞 ⇒ない
名詞だけを見れば、納得しているのか、納得していないのか、わかりません。
ポジティブ、ネガティブな意見の件数をカウントする場合、
テキスト件数が多い場合には、目検で件数を拾うことは現実的ではありません。
こういう場合に、どのように接近すればよいのでしょうか?
否定助動詞、ナイ形容詞(今回は出現していません)に着目して、
KWICコンコーダンスで確認して、件数を拾うということになるのでしょうか?
否定助動詞、ナイ形容詞(今回は出現していません)に着目して、
コーディングファイルを作成して、件数を拾うことになるのでしょうか?
語〜語のクロス表を自作して、判断するという手もあると思います。
しかし、「ない」と「値上げ」が共起出現するということで、
抽出語だけを見ていると、「値上げ」が「ない」と誤認識する恐れがあります。
可視化するという手もあります。
共起ネットワークでも、「値上げ」〜「ない」にエッジが張られますので、
やはり、「値上げ」が「ない」と誤認識する恐れがあります。
難しいですね。
ご助言をいただければ助かります。