Re: 特徴語の取り出し方と「どちらにも重要であろう語」 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.3243] Re: 特徴語の取り出し方と「どちらにも重要であろう語」 投稿者:HIGUCHI Koichi  投稿日:2017/10/31(Tue) 21:53:28

こんにちは、樋口です。書き込みありがとうございます。

基本的には、男性・女性のどちらかに偏って出現する語を「特徴語」として
リストアップしています。そうした語を探すために、設定を変えない状態で
はJaccard係数を使っています。

Jaccard係数については以前にスライドを作ったことがあります。ご参考にし
ていただけましたら幸いです。
https://www.slideshare.net/khcoder/jaccard2


こうした定義から、この分析では、「どちらにも重要であろう語」はリスト
アップされにくいと思います。「重要」というところは難しいのですが、ど
ちらにも多く出現する語という意味なら、対応分析で見ることはできるでし
ょう。対応分析ならば、「女性」に多い語は、原点から見て「女性」側に遠
く離れます。それにたいして、どちらにも多く出現する語は「女性」と「男
性」の中間にプロットされるのでしょう。そうした語も見たい場合には、
対応分析を実行する際に、「差異が顕著な語を分析に使用」のチェックを外
しておいてください。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)