こんにちは、樋口です。書き込みありがとうございます。
基本的には、男性・女性のどちらかに偏って出現する語を「特徴語」として
リストアップしています。そうした語を探すために、設定を変えない状態で
はJaccard係数を使っています。
Jaccard係数については以前にスライドを作ったことがあります。ご参考にし
ていただけましたら幸いです。
https://www.slideshare.net/khcoder/jaccard2
こうした定義から、この分析では、「どちらにも重要であろう語」はリスト
アップされにくいと思います。「重要」というところは難しいのですが、ど
ちらにも多く出現する語という意味なら、対応分析で見ることはできるでし
ょう。対応分析ならば、「女性」に多い語は、原点から見て「女性」側に遠
く離れます。それにたいして、どちらにも多く出現する語は「女性」と「男
性」の中間にプロットされるのでしょう。そうした語も見たい場合には、
対応分析を実行する際に、「差異が顕著な語を分析に使用」のチェックを外
しておいてください。