Re: 対応分析について (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.546] Re: 対応分析について 投稿者:HIGUCHI Koichi  投稿日:2009/11/17(Tue) 19:12:29

こんにちは、樋口です。書き込みありがとうございます。

> 1.対応分析結果の「成分」というのは各次元の説明率のことでしょうか。

KH Coderが作成する対応分析のプロットにおいては、横軸・縦軸ともに「成分
1(60%)」のような記述が付記されています。例えば横軸に「成分1(60%)」
という記述がある場合ですと、「プロットの横軸には成分1のスコアを用いて
おり、その成分1の寄与率は60%であった」ことを意味します。

前述の大隅昇先生によるご解説「対応分析法・数量化法III類の考え方.pdf」
(25ページ目・108/60)では、「第1成分スコア」「第2成分スコア」といった
用語が使われておりますが、それを単に「成分1」「成分2」と表記しておりま
す。

したがって、おそらく「成分」というのはお書きになっている「次元」と同様
の意味合いかと思います。カッコ内の数値については、成分の寄与率(次元の
説明率と同意でしょうか)で間違いありません。

> 2.テキストデータの対象を広げると「成分」が下がる傾向にあります。

「成分」ではなく、「成分の寄与率」のこととしてお答えさせていただきます。

これは一般的な傾向だと思います。対応分析では、2元のデータ表を入力デー
タとして解析が行われます。この入力となるデータ表が大きくなるほど、取り
出せる成分の数が多くなりますので、1つの成分あたりの寄与率は小さくなっ
ていくのが一般的です。

こうしたことから、前述の「対応分析法・数量化法III類の考え方.pdf」(58
ページ目・141)においても「一般にこの種のデータ表の対応分析で得られる
固有値(とその寄与率)は,値が小さくあたかも寄与が低いように見えるが
それはデータ表の構造的な制約から生じるものである」と解説されているもの
と思います。

そうした値ですので、テキスト型データを分析する場合には寄与率が数%とい
うこともめずらしくありません。ある種の参考程度にこの値をご覧になること
をお勧めいたします。

以上、ご参考になりましたら幸いです。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)