Re: 外部変数を用いた特徴語の抽出法について (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1291] Re: 外部変数を用いた特徴語の抽出法について 投稿者:HIGUCHI Koichi  投稿日:2013/02/13(Wed) 11:18:48

こんにちは、樋口です。ご丁寧な書き込みをお寄せいただき、まことにありが
とうございます。

ごく大まかには、すべての語について、「男性の回答に特徴的である度合い」
をJaccard係数によって測定し、Jaccard係数が大きい語から順に表示していま
す。女性についても同じことをしています。これによって、ほぼ自動的に、男
女に共通の語は結果から除かれます。

もう少し具体的な計算としては、「語Aが出現していれば1、出現していなけれ
ば0」という変数と、「男性の回答であれば1、そうでなければ0」という変数
との関連を、Jaccard係数によって測定しています。この結果が、語Aの「男性
の回答に特徴的である度合い」です。この計算を語Aだけでなくすべての語に
ついて行っています。

したがって、「特徴語」であることの裏付けは、基本的にはJaccard係数のみ
ということになるでしょう。

KH Coderの機能としては「関連語検索」というコマンドがあり、このコマンド
で上述の計算は行っています。マニュアルでは表記が「関連語探索」となって
おり、少しややこしくて申し訳ないのですが、このコマンドの解説(5.7節)
もご参照いただければ幸甚です。

上記の説明やマニュアルの記載についてご不明の点がございましたら、ご遠慮
なく続けて書き込みしてただければと存じます。

どうぞよろしくお願いいたします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)