Re: 英語環境における否定の扱い (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.2029] Re: 英語環境における否定の扱い 投稿者:HIGUCHI Koichi  投稿日:2015/04/22(Wed) 19:29:27

こんにちは、樋口です。
書き込みありがとうございます。

否定されているかどうか(否定文かどうか)を自動的に判定するような仕組み
は、今のところ、取り入れていません。したがって現在のKH Coderでは、特定
の語が否定されているかどうかを、高い精度で、厳密に区別するのはなかなか
難しいかもしれません。

できることとしては、notやunableなどの否定語が、「open」と共起している
かどうかを見ると良いかもしれません。たとえば共起ネットワーク上で「can
」と「open」がつながっていて、そこに「not」もつながっていれば「開けら
れなかったんだな」と理解できます。

またコーディングルール作成時に、「notやunable…もあること」「notやunab
le…がないこと」といった条件を指定して数え上げることも一手でしょう。

さらに書きますと、「ある時期のある製品についての問い合わせ内に、ほかよ
りも『open』『function』という語が多い」と統計分析でわかったら、やはり
原文にあたるのが良いと思います。その時期・製品についての問い合わせ内で、
「open」「function」がどのように使われているのかを、人間が確認するので
す。人が見れば否定されているかどうかはすぐに分かるでしょう。


p.s.
詳しくは「KH Coderの本」にもありますが、統計分析・自動処理だけで分かる
ことには限りがありますので、ほどよく、元の文章(原文)にも当たることが
お勧めです。たとえば、「この語が特徴的」「この部分が特徴的」と統計分析
から分かれば、その語/部分を人間が見に行くといった形です。

そうした形で、統計分析・自動処理で片付ける部分と、人間が目視で確認する
部分とを上手く切り分けることがポイントかなと個人的には思っています。
「すべてを自動処理で」と考えると、非常に高額の費用を要したり、技術的な
壁にぶつかってしまうかもしれません。

(とはいえ、否定されているかどうかの検出くらいは自動化しても良いかもし
れないのですが…)


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)