Re: 対応分析について (HIGUCHI Koichi) KH Coder 旧掲示板

こんにちは、樋口です。書き込みありがとうございます。

> 1.対応分析結果の「成分」というのは各次元の説明率のことでしょうか。

KH Coderが作成する対応分析のプロットにおいては、横軸・縦軸ともに「成分
1（60%）」のような記述が付記されています。例えば横軸に「成分1（60%）」
という記述がある場合ですと、「プロットの横軸には成分1のスコアを用いて
おり、その成分1の寄与率は60%であった」ことを意味します。

前述の大隅昇先生によるご解説「対応分析法・数量化法III類の考え方.pdf」
（25ページ目・108/60）では、「第1成分スコア」「第2成分スコア」といった
用語が使われておりますが、それを単に「成分1」「成分2」と表記しておりま
す。

したがって、おそらく「成分」というのはお書きになっている「次元」と同様
の意味合いかと思います。カッコ内の数値については、成分の寄与率（次元の
説明率と同意でしょうか）で間違いありません。

> 2．テキストデータの対象を広げると「成分」が下がる傾向にあります。

「成分」ではなく、「成分の寄与率」のこととしてお答えさせていただきます。

これは一般的な傾向だと思います。対応分析では、2元のデータ表を入力デー
タとして解析が行われます。この入力となるデータ表が大きくなるほど、取り
出せる成分の数が多くなりますので、1つの成分あたりの寄与率は小さくなっ
ていくのが一般的です。

こうしたことから、前述の「対応分析法・数量化法III類の考え方.pdf」（58
ページ目・141）においても「一般にこの種のデータ表の対応分析で得られる
固有値（とその寄与率）は，値が小さくあたかも寄与が低いように見えるが
それはデータ表の構造的な制約から生じるものである」と解説されているもの
と思います。

そうした値ですので、テキスト型データを分析する場合には寄与率が数%とい
うこともめずらしくありません。ある種の参考程度にこの値をご覧になること
をお勧めいたします。

以上、ご参考になりましたら幸いです。