こんにちは、樋口です。書き込みありがとうございます。
> 1.対応分析結果の「成分」というのは各次元の説明率のことでしょうか。
KH Coderが作成する対応分析のプロットにおいては、横軸・縦軸ともに「成分
1(60%)」のような記述が付記されています。例えば横軸に「成分1(60%)」
という記述がある場合ですと、「プロットの横軸には成分1のスコアを用いて
おり、その成分1の寄与率は60%であった」ことを意味します。
前述の大隅昇先生によるご解説「対応分析法・数量化法III類の考え方.pdf」
(25ページ目・108/60)では、「第1成分スコア」「第2成分スコア」といった
用語が使われておりますが、それを単に「成分1」「成分2」と表記しておりま
す。
したがって、おそらく「成分」というのはお書きになっている「次元」と同様
の意味合いかと思います。カッコ内の数値については、成分の寄与率(次元の
説明率と同意でしょうか)で間違いありません。
> 2.テキストデータの対象を広げると「成分」が下がる傾向にあります。
「成分」ではなく、「成分の寄与率」のこととしてお答えさせていただきます。
これは一般的な傾向だと思います。対応分析では、2元のデータ表を入力デー
タとして解析が行われます。この入力となるデータ表が大きくなるほど、取り
出せる成分の数が多くなりますので、1つの成分あたりの寄与率は小さくなっ
ていくのが一般的です。
こうしたことから、前述の「対応分析法・数量化法III類の考え方.pdf」(58
ページ目・141)においても「一般にこの種のデータ表の対応分析で得られる
固有値(とその寄与率)は,値が小さくあたかも寄与が低いように見えるが
それはデータ表の構造的な制約から生じるものである」と解説されているもの
と思います。
そうした値ですので、テキスト型データを分析する場合には寄与率が数%とい
うこともめずらしくありません。ある種の参考程度にこの値をご覧になること
をお勧めいたします。
以上、ご参考になりましたら幸いです。