Re: 2値変数と対応分析 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.699] Re: 2値変数と対応分析 投稿者:HIGUCHI Koichi  投稿日:2010/12/27(Mon) 16:04:02

こんにちは、樋口です。書き込みありがとうございます。


変数の値が「男性」「女性」のように2種類だけですと、対応分析に投入するデ
ータ表も当然「男性」で1行、「女性」で1行、合わせて2行のデータ表になりま
す。お書きいただいた通りこの場合には、有効な成分と言いますか、寄与率が0
でない成分と言いますかは、1つしか抽出されません。

これは「そういうもの」でして、何か失敗しているというわけではありません。
値が「男性」「女性」の2種類なのですから、「男性ほど××で、逆に女性ほど
○○」という1つの成分/軸/次元しか抽出できないとお考えいただいてよいか
と思います。(詳細は対応分析についての解説・文献をあたって下さい)

添付していただいた結果の場合、成分1(横軸/x軸)にのみ注目すれば、解釈
は可能だと思います。仮に右の黒い■が「男性」ならば、中央から右に行くほ
ど「男性」に多かった語、というふうに解釈できるはずです。左の黒い■が
「女性」ならば、中央から左に行くほど「女性」に特徴的な語ということにな
るでしょう。ただし、上下の布置(成分2)には意味がありません。


そういうわけで、「男性」「女性」のような2値変数であっても、対応分析の
プロットから「男性」「女性」の特徴を見ることは可能です。しかし、縦軸
(成分2)には意味が無いので、あまりスマートな方法とは言えません。「男
性」「女性」の特徴を見るだけであれば、チュートリアルの表2にように、
「関連語探索」を使って表形式にまとめた方がすっきりするでしょう。

あるいは、性別と組み合わせることで意味がある変数を考えるのも一手でしょ
う。例えば性別と年齢といった組み合わせです。変数の値を「女性20代」「女
性30代」「女性40代」「男性20代」「男性30代」「男性40代」…としたものを
よく見かけるように思います。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)