くわしい回答ありがとうございます。ご指導の通りに進めてみました。男女別に特徴語についてのジャガード係数が出ました。係数がどのぐらいの値なら類似度が高いと判断すればよいでしょうか。0.341〜0.047ぐらいの幅で値が出ています。よろしくお願いします。