はじめまして。吉田と申します。
自由記述式のアンケート調査の分析にKH Coderを使わせて頂いて
おります。外部変数によって指定されたカテゴリーごとの「特徴語」
について質問させて頂きたいと思います。お時間があります折に
ご教授頂ければ幸いです。以下に具体的に書かせて頂きます。
「ツール」 > 「外部変数と見出し」メニュー > 「リスト」の
コマンドから、「▽特徴語」の「一覧」を実行しました。
外部変数は「男性」と「女性」の2つのカテゴリカル変数としました。
Excelに男女それぞれの特徴語とJaccard係数が出力されますが、
この際、各カテゴリの特徴語はどのような数理的処理を経て
抽出されるのでしょうか。また、各カテゴリ間に共通する頻出語は、
どのように当該リストから除かれているのでしょうか。宜しければ、
詳しく教えて頂きたく存じます。
過去ログを拝見したところ、以前他の質問者様に対するご回答に、
「男性に特徴的な語というのは、この場合、女性の回答に少なく、
男性の回答に多い語です。男性と女性とを比べて、男性の回答に
特に多い語ということです」とお書きになっておられました。
特徴語がそれぞれ重複することなくカテゴリごとに鮮やかに出力され、
解釈や考察が非常に楽しみではありますが、これらの特徴語が、
果たしてどのような裏付け・処理のもとに「特徴語」として
扱われているのだろうか、と疑問に思った次第です。
稚拙な質問で恐縮では御座いますが、宜しくお願い致します。
失礼します。