[掲示板へもどる]
一括表示

  [No.698] 対応分析時の外部変数について 投稿者:田中  投稿日:2010/12/27(Mon) 14:09:49
対応分析時の外部変数について (画像サイズ: 640×640 30kB)

樋口様

初めて質問させていただきます。
KHCoderで自由記述アンケートの分析をしております田中と申します。
外部変数を用いた対応分析について質問させていただきます。

外部変数が性別(男性、女性)というような2種類しかない場合の分析をすると、対応分析の成分1の寄与率が必ず100%になってしまうのですが、コーディング×対応分析のように3つ以上の変数がないと分析ができないということなのでしょうか?(図の黒点が男女)
それとも、上述の性別の例だと男女に差がないという解釈になるのでしょうか?

なぜこのような結果になるのか知りたいと思いましたので、宜しくお願いいたします。


  [No.699] Re: 2値変数と対応分析 投稿者:HIGUCHI Koichi  投稿日:2010/12/27(Mon) 16:04:02

こんにちは、樋口です。書き込みありがとうございます。


変数の値が「男性」「女性」のように2種類だけですと、対応分析に投入するデ
ータ表も当然「男性」で1行、「女性」で1行、合わせて2行のデータ表になりま
す。お書きいただいた通りこの場合には、有効な成分と言いますか、寄与率が0
でない成分と言いますかは、1つしか抽出されません。

これは「そういうもの」でして、何か失敗しているというわけではありません。
値が「男性」「女性」の2種類なのですから、「男性ほど××で、逆に女性ほど
○○」という1つの成分/軸/次元しか抽出できないとお考えいただいてよいか
と思います。(詳細は対応分析についての解説・文献をあたって下さい)

添付していただいた結果の場合、成分1(横軸/x軸)にのみ注目すれば、解釈
は可能だと思います。仮に右の黒い■が「男性」ならば、中央から右に行くほ
ど「男性」に多かった語、というふうに解釈できるはずです。左の黒い■が
「女性」ならば、中央から左に行くほど「女性」に特徴的な語ということにな
るでしょう。ただし、上下の布置(成分2)には意味がありません。


そういうわけで、「男性」「女性」のような2値変数であっても、対応分析の
プロットから「男性」「女性」の特徴を見ることは可能です。しかし、縦軸
(成分2)には意味が無いので、あまりスマートな方法とは言えません。「男
性」「女性」の特徴を見るだけであれば、チュートリアルの表2にように、
「関連語探索」を使って表形式にまとめた方がすっきりするでしょう。

あるいは、性別と組み合わせることで意味がある変数を考えるのも一手でしょ
う。例えば性別と年齢といった組み合わせです。変数の値を「女性20代」「女
性30代」「女性40代」「男性20代」「男性30代」「男性40代」…としたものを
よく見かけるように思います。


  [No.700] Re: 2値変数と対応分析 投稿者:田中  投稿日:2010/12/27(Mon) 16:43:17

早々のご回答ありがとうございます。
勉強不足でした。すみません。
変数を組み合わせて再トライしてみようと思います。
ありがとうございました。