[掲示板へもどる]
一括表示

  [No.542] 対応分析について 投稿者:Rei  投稿日:2009/11/15(Sun) 22:38:28

初学者なもので、自分なりに調べましたが分からなかったため質問させて頂きたいと思います。

KHコーダーでは対応分析を行うことができますが、これは単純対応分析ですか?それとも多重対応分析ですか?

また、カテゴリースコアや固有値の説明率等はどのように求めることができるでしょうか。

対応分析自体に詳しくないため、的外れな質問でしたら申し訳ございません。分析結果を文章に表すため、対応分析の分析法の詳細を総じて知りたいと思います。

お手数ですがよろしくお願い致します。


  [No.543] Re: 対応分析について [11/16訂正] 投稿者:HIGUCHI Koichi  投稿日:2009/11/15(Sun) 23:35:11

こんにちは、樋口です。書き込みありがとうございます。

KH Coderでは以下のような2元のデータ表を入力として、対応分析を行ってい
ます。
 ・「抽出語 x 文書」の表
 ・「抽出語 x 外部変数」の表
 ・「コード x 文書」の表
 ・「コード x 上位の章・節・段落」の表
 ・「コード x 外部変数」の表
私の理解では、対応分析の入力データがある一定の形状の場合に、「多重対応
分析」と呼ぶのだと思いますが、上のいずれもそれには当たりません。

具体的にはRを用いて計算を行っていまして、こちらの金明哲先生による解説の
2.1節および2.2節(1)と同様、correspコマンドを使って計算しています。
http://www1.doshisha.ac.jp/~mjin/R/26.pdf

そもそも対応分析とは、ということにつきましては、テキスト・マイニング研
究会(代表:大隅昇先生)のサイトに、かなりまとまった解説があるかと思い
ます。
http://wordminer.comquest.co.jp/wmtips/analysis.html
「対応分析法・数量化法III類の考え方.pdf」など

以上、ご参考になりましたら幸いです。
どうぞよろしくお願いいたします。


  [No.544] Re: 対応分析について 投稿者:Rei  投稿日:2009/11/16(Mon) 22:08:08

お返事ありがとうございます。
私自身まだまだソフトと統計処理を扱いきれないのでリンク先が大変参考になりました。
まだ不可解な部分もありますが、先ずは自分で他の文献やソフトウェアとの連携などを試みてから改めて質問させて頂きたいと思います。

ありがとうございました。


  [No.545] Re: 対応分析について 投稿者:Rei  投稿日:2009/11/17(Tue) 15:56:54

その後自分なりに解釈した結果、2つほど質問が残りましたのでご教授願いたいと思います。

1.対応分析結果の「成分」というのは各次元の説明率のことでしょうか。

2.テキストデータの対象を広げると「成分」が下がる傾向にあります。
 例えばオイディプス神話を分析しようとする場合、分析対象のチャプターを増やせば増やすほど、同じ物語であっても成分が下がる傾向にあります。
 試しに「こころ」の「下 先生と遺書」を外してチュートリアル通りの分析を行ったところ成分が確かに上がっていますね。
 この現象はテキストデータが増えてしまったためにプロフィルが低くなった等の理由があるのでしょうか?

お手数ですがお返事お待ちしております。


  [No.546] Re: 対応分析について 投稿者:HIGUCHI Koichi  投稿日:2009/11/17(Tue) 19:12:29

こんにちは、樋口です。書き込みありがとうございます。

> 1.対応分析結果の「成分」というのは各次元の説明率のことでしょうか。

KH Coderが作成する対応分析のプロットにおいては、横軸・縦軸ともに「成分
1(60%)」のような記述が付記されています。例えば横軸に「成分1(60%)」
という記述がある場合ですと、「プロットの横軸には成分1のスコアを用いて
おり、その成分1の寄与率は60%であった」ことを意味します。

前述の大隅昇先生によるご解説「対応分析法・数量化法III類の考え方.pdf」
(25ページ目・108/60)では、「第1成分スコア」「第2成分スコア」といった
用語が使われておりますが、それを単に「成分1」「成分2」と表記しておりま
す。

したがって、おそらく「成分」というのはお書きになっている「次元」と同様
の意味合いかと思います。カッコ内の数値については、成分の寄与率(次元の
説明率と同意でしょうか)で間違いありません。

> 2.テキストデータの対象を広げると「成分」が下がる傾向にあります。

「成分」ではなく、「成分の寄与率」のこととしてお答えさせていただきます。

これは一般的な傾向だと思います。対応分析では、2元のデータ表を入力デー
タとして解析が行われます。この入力となるデータ表が大きくなるほど、取り
出せる成分の数が多くなりますので、1つの成分あたりの寄与率は小さくなっ
ていくのが一般的です。

こうしたことから、前述の「対応分析法・数量化法III類の考え方.pdf」(58
ページ目・141)においても「一般にこの種のデータ表の対応分析で得られる
固有値(とその寄与率)は,値が小さくあたかも寄与が低いように見えるが
それはデータ表の構造的な制約から生じるものである」と解説されているもの
と思います。

そうした値ですので、テキスト型データを分析する場合には寄与率が数%とい
うこともめずらしくありません。ある種の参考程度にこの値をご覧になること
をお勧めいたします。

以上、ご参考になりましたら幸いです。


  [No.547] Re: 対応分析について 投稿者:Rei  投稿日:2009/11/17(Tue) 20:58:36

迅速かつ丁寧なご回答ありがとうございます。
おかげさまで何となく理解していた分析の特徴が確かなものになりました。

大変良いソフトウェアですので、今後とも知識を深めながら利用させていただきたいと思います。
ありがとうございました。


  [No.548] Re: 対応分析について 投稿者:HIGUCHI Koichi  投稿日:2009/11/17(Tue) 23:14:45

こんにちは、樋口です。書き込みありがとうございます。

いまだKH Coderは完成品という状態には程遠いため、まだまだ分かりにくい部
分・使いにくい部分など残っているかと存じます。また何かご不明な点等ござ
いましたら、お気軽に書き込みしていただけましたら幸いです。

今後ともどうぞよろしくお願いいたします。