こんにちは、樋口です。書き込みありがとうございます。
> どちらにも特徴的な語の出現頻度を比べれば、男女の類似性を見ることも可
> 能ということになるのでしょうか。
今回はカテゴリーの数が「男性」「女性」の2つですので、「男性に特徴的な
語」=「男性に比較的多い語」=「女性には比較的少ない語」となっています。
したがって、理論的には「男性と女性の両方に特徴的」ということは起こりに
くいですし、そうした語に注目することは計算の主旨から少し外れます。
今回の場合、Jaccard係数の表は、あくまでも男女の違い・差異を見るための
ものとお考えください。
そして、頻出150語(特に上位の語)の中で、Jaccard係数の表に登場しなかっ
た語を探してみて下さい。そうした語は「男女どちらかに偏っていない」=「
男女に共通して使用される語」=「(お書きになった意味での)男女の類似性
をあらわす語」と解釈できます。
※カテゴリーの数が3つ以上ある場合は、カテゴリーAとカテゴリーBで、とも
に語αが特徴的ということが起こりえます。また、それに注目して、カテゴリ
ーAとカテゴリーBの共通点・類似点を解釈することはあり得ます。
やや実験的な機能ではありますが、共起ネットワークの画面で「語 ― 外部変
数・見出し」を選択し、変数として「性別」を選んで「OK」をクリックするの
も一手でしょう。結果として得られるネットワークで、「男性」だけとつなが
っている語は、「男性」に特徴的な語です。また、「男性」「女性」の両方と
つながっている語は、男女に共通して使われる語と見なせます。
※上記の2つの表を見る方法とおおむね同じ結果になるはずです。ただ、2つの
表を1つの図にまとめるわけですから、情報量は減るでしょう。その代わりに、
分かりやすく/読み取りやすくなるかもしれません。
p.s.
各ポストのタイトルを、内容をあらわすものに変更させていただきました。