[掲示板へもどる]
一括表示

  [No.3231] データの準備と分析単位について 投稿者:ONISHI  投稿日:2017/10/28(Sat) 21:48:02

樋口先生

初めて投稿させていただきます。
勉強不足なため、初歩的な質問かもしれませんが、どうしても分からなかったので、
投稿させていただくことにいたしました。

今、自由回答における男女別の回答内容の特徴をKH Coderを用いて分析しようと思っております。
そこで、まず「外部変数と見出し」で、外部変数として「性別」を指定して
特徴語を男女別に出力してみました。
ですが、エクセルの1つのセルに自由回答を一文ずつ入力した場合と、
1つのセルに同一回答者の書いた複数の自由回答を入力した場合では、
分析単位を同じ「文」に指定しても同じ結果にはなりませんでした。
この2つの場合では、前処理の後に表示される単純集計の時点で「文」などの数が異なっていたので、
それが原因で計算に用いられる分母の数が異なり、出力結果が異なっているのではないかとは思っています。
しかしながら、同じ数の文を入力しても、エクセルへの入力の仕方ひとつで単純集計における
結果が違うのかが気になりますし、このように集計された数が異なる場合に、どのようにデータをエクセルに入力し、
どの集計単位を指定すべきなのか判断ができずに迷っています。

1文ずつ1つのセルに入力した理由は、「自由回答の各文に注目」するには、この方法がふさわしいと思ったからで、
その後、1つのセルに、回答者ごとの回答全体(同じ回答者の書いた複数の回答文)を入力してみたのですが、その理由は、
分析単位の指定次第で、「回答者ごとの記述内容全体」にも「各回答者の回答全体がどのような文脈になっているかに関わらず、とにかく自由回答の1文」にも
注目することができるのではないかと思ったからです。

前置きが長くなってしまったのですが、

入力したはずの文の数と、KH Coderで単純集計される数がなぜ異なるのか。
 そして、同じ文の数でも、エクセルへの入力次第でなぜ異なるのか。

自由記述における男女の回答内容の特徴を比較したい場合、どのようにデータを準備し、
 男女ごとに特徴語のJaccard係数算出の際に、分析単位を何に指定すべきか、
あるいは、何を基準に集計単位を決めるものなのか。
(私は、「あるテーマについて考えた際に、自由回答に現れる回答者の想起した語や概念、着眼点における男女の違いに注目しようとする」ならば、各セルに回答者ごとの回答全体を入力し、分析単位を「各回答者の回答全体(各セル)」になるように指定するのが妥当かと思っておりましたが、これはよい判断でしょうか。)

上記の2点について、質問させていただきたいです。

お忙しい中、大変恐縮なのですが、どうかご回答していただければと思います。
どうぞよろしくお願い致します。


  [No.3232] Re: KH Coder 3における見出し文の扱いの改善 投稿者:HIGUCHI Koichi  投稿日:2017/10/28(Sat) 22:28:21

こんにちは、樋口です。書き込みありがとうございます。

文の数の扱いはKH Coder 3で大きく改善したポイントです。

マニュアルのA.3.1節に記述してありますように、Excel・CSVファイルをテキ
スト形式に自動変換する際には、見出し文が挿入されます。KH Coder 2はこの
見出し文を、文としてカウントしているのです。

KH Coder 3
http://khc.sourceforge.net/dl3.html

> Ver. 3.Alpha.7での変更点
> ■H1からH5タグで括った見出しの扱いを変更した。
> ◇こうした見出しも1つの「文」と見なして数えるのが従来の仕様であった。
> しかしExcel形式のファイルを読み込んだときや、多数のテキストファイルを
> 自動的に1つにまとめた時には、データを区切るために、自動的に見出し文が
> 挿入される。こうした自動挿入された単なる区切りは、「文」として数えない
> ようにした。
> ◇詳細は同梱マニュアルのA.2.1節、「それぞれの単位でのコーディングや検索」
> の項に記載。

KH Coder 3をお試しいただいて、文の数が一致するかどうかお知らせいただけ
ますか?


  [No.3235] Re: KH Coder 3における見出し文の扱いの改善 投稿者:ONISHI  投稿日:2017/10/29(Sun) 19:36:13

Re: KH Coder 3における見出し文の扱いの改善 (画像サイズ: 511×614 28kB)

樋口先生

お返事ありがとうございます。
私がマニュアルを熟読できていませんでした。
申し訳ありませんでした。

これまで、KH Coder 2で分析していたのですが、
KH Coder 3でを使ってみたところ、エクセルへのデータの入力の仕方によらず
文の数は一致していました。
ありがとうございます。

また、ひとつ疑問が生じたので、質問させてください。
マニュアルのA.8.2「リスト」を見ながら、自由回答を男女別に見たときに
男女それぞれにどのような特徴語が見られるのか気になり、
特徴語を男女別にリストアップしてみたのですが、
男女ともによく使用しているであろう、あるいは、どちらにとっても重要な概念であると思われる単語でさえ
どちらか一方にのみ振り分けられているように思いました。
外部変数の値ごとに見られる特徴語なので、リストアップされた語が、
男女で同じ語がリストに含まれないようにしているのかなと思ったのですが、
男女どっちにとっても重要な単語、あるいは共通してよく見られる単語は
どのように扱われているのか気になりました。

外部変数が男女である場合に、どちらにも重要であろう語は、特徴語のリスト外にあるのですか?
また、どのような基準で特徴語と判断してリストアップされているのですか?
この2点について教えていただけますでしょうか。
重ねて質問してしまい、大変申し訳ございません。

お返事よろしくお願いいたします。

大西


  [No.3236] Re: KH Coder 3における見出し文の扱いの改善 投稿者:ONISHI  投稿日:2017/10/29(Sun) 19:42:38

樋口先生

先程投稿したものに、添付しようかしまいかと悩んでいた画像を
誤って添付してしましました。

画像の方は、今回私が自由回答をKH Coder 3を用いて
男女別で出力した特徴語を上位10語ずつ記載したものです。
(データをどの程度公式の場で出していいのかわからず、抽出語はあえてアルファベットに置き換えています。)
誤って添付してしまい、申し訳ございません。
画像の方は無視していただけたらと思います。
大変失礼しました。


  [No.3243] Re: 特徴語の取り出し方と「どちらにも重要であろう語」 投稿者:HIGUCHI Koichi  投稿日:2017/10/31(Tue) 21:53:28

こんにちは、樋口です。書き込みありがとうございます。

基本的には、男性・女性のどちらかに偏って出現する語を「特徴語」として
リストアップしています。そうした語を探すために、設定を変えない状態で
はJaccard係数を使っています。

Jaccard係数については以前にスライドを作ったことがあります。ご参考にし
ていただけましたら幸いです。
https://www.slideshare.net/khcoder/jaccard2


こうした定義から、この分析では、「どちらにも重要であろう語」はリスト
アップされにくいと思います。「重要」というところは難しいのですが、ど
ちらにも多く出現する語という意味なら、対応分析で見ることはできるでし
ょう。対応分析ならば、「女性」に多い語は、原点から見て「女性」側に遠
く離れます。それにたいして、どちらにも多く出現する語は「女性」と「男
性」の中間にプロットされるのでしょう。そうした語も見たい場合には、
対応分析を実行する際に、「差異が顕著な語を分析に使用」のチェックを外
しておいてください。


  [No.3247] Re: 特徴語の取り出し方と「どちらにも重要であろう語」 投稿者:ONISHI  投稿日:2017/11/05(Sun) 18:24:28

樋口先生

返信が遅れてしまい、申し訳ございません。
Jaccard係数のスライドをご紹介くださり、ありがとうございました。
スライドを参考に勉強しなおして、データの分析結果がどのようにして
導き出されたものなのかを踏まえて、男性・女性の回答にみられる特徴語を
見つけ出していきたいと思います。
また、男女両方によく見られるという意味で「重要な」語があるとしたら
どういった単語なのかということも対応分析で見てみたいと思います。
丁寧なご対応、本当にありがとうございました。


  [No.3242] Re: 自由回答データを分析用に準備する 投稿者:HIGUCHI Koichi  投稿日:2017/10/31(Tue) 21:44:24

こんにちは、樋口です。書き込みありがとうございます。

> 各セルに回答者ごとの回答全体を入力し、分析単位を「各回答者の回答全体
> (各セル)」になるように指定

私もこれで良いように思います。各セルを分析単位とするには、デフォルトの
単位H5をそのままお使い下さい。

もし、同じ人の回答でも一文ごとに内容が大きく異なるような場合は、分析
単位を「文」にしてみても良いかもしれません。データ入力をやり直す必要
はなく、KH Coder上で「文」を選択するだけです。


なお、A列に自由回答を入力した場合、B列に性別、C列に年代、、、と入力し
ていけば、性別や年代による回答の違いを見ることができます。


  [No.3248] Re: 自由回答データを分析用に準備する 投稿者:ONISHI  投稿日:2017/11/05(Sun) 18:31:24

樋口先生

一度に多くの質問をしてしまったにも関わらず、ご回答していただき、
本当にありがとうございました。

分析単位で結果の出方が変わるので、自分の調査の目的に合わせて
「H5」と「文」の指定をどちらにするか、慎重に決めてみようと思います。

ご指導ありがとうございました。
また、質問させていただくこともあるかと思いますが、
どうぞよろしくお願い致します。