こんにちは、樋口です。書き込みありがとうございます。
ご希望に添えず恐縮なのですが、KH Coderで言う特徴語とは、比較によって得
られるものなのです。「女性に比べて(あるいは全体に比べて)、男性の回答
ではこの言葉が多い」といった比較を行なうことで、男性に特徴的な語を探し
ています。このため、データ全体の特徴語というものを計算することはできま
せん。
ランダムサンプリングした新聞記事や「均衡コーパス」と呼ばれるものを比較
対象にすることで、そのデータ全体の特徴語を出せるかもしれませんが、結構
大がかりになるかもしれません。