初学者なもので、自分なりに調べましたが分からなかったため質問させて頂きたいと思います。KHコーダーでは対応分析を行うことができますが、これは単純対応分析ですか?それとも多重対応分析ですか?また、カテゴリースコアや固有値の説明率等はどのように求めることができるでしょうか。対応分析自体に詳しくないため、的外れな質問でしたら申し訳ございません。分析結果を文章に表すため、対応分析の分析法の詳細を総じて知りたいと思います。お手数ですがよろしくお願い致します。
こんにちは、樋口です。書き込みありがとうございます。KH Coderでは以下のような2元のデータ表を入力として、対応分析を行っています。 ・「抽出語 x 文書」の表 ・「抽出語 x 外部変数」の表 ・「コード x 文書」の表 ・「コード x 上位の章・節・段落」の表 ・「コード x 外部変数」の表私の理解では、対応分析の入力データがある一定の形状の場合に、「多重対応分析」と呼ぶのだと思いますが、上のいずれもそれには当たりません。具体的にはRを用いて計算を行っていまして、こちらの金明哲先生による解説の2.1節および2.2節(1)と同様、correspコマンドを使って計算しています。http://www1.doshisha.ac.jp/~mjin/R/26.pdfそもそも対応分析とは、ということにつきましては、テキスト・マイニング研究会(代表:大隅昇先生)のサイトに、かなりまとまった解説があるかと思います。http://wordminer.comquest.co.jp/wmtips/analysis.html「対応分析法・数量化法III類の考え方.pdf」など以上、ご参考になりましたら幸いです。どうぞよろしくお願いいたします。
お返事ありがとうございます。私自身まだまだソフトと統計処理を扱いきれないのでリンク先が大変参考になりました。まだ不可解な部分もありますが、先ずは自分で他の文献やソフトウェアとの連携などを試みてから改めて質問させて頂きたいと思います。ありがとうございました。
その後自分なりに解釈した結果、2つほど質問が残りましたのでご教授願いたいと思います。1.対応分析結果の「成分」というのは各次元の説明率のことでしょうか。2.テキストデータの対象を広げると「成分」が下がる傾向にあります。 例えばオイディプス神話を分析しようとする場合、分析対象のチャプターを増やせば増やすほど、同じ物語であっても成分が下がる傾向にあります。 試しに「こころ」の「下 先生と遺書」を外してチュートリアル通りの分析を行ったところ成分が確かに上がっていますね。 この現象はテキストデータが増えてしまったためにプロフィルが低くなった等の理由があるのでしょうか?お手数ですがお返事お待ちしております。
こんにちは、樋口です。書き込みありがとうございます。> 1.対応分析結果の「成分」というのは各次元の説明率のことでしょうか。KH Coderが作成する対応分析のプロットにおいては、横軸・縦軸ともに「成分1(60%)」のような記述が付記されています。例えば横軸に「成分1(60%)」という記述がある場合ですと、「プロットの横軸には成分1のスコアを用いており、その成分1の寄与率は60%であった」ことを意味します。前述の大隅昇先生によるご解説「対応分析法・数量化法III類の考え方.pdf」(25ページ目・108/60)では、「第1成分スコア」「第2成分スコア」といった用語が使われておりますが、それを単に「成分1」「成分2」と表記しております。したがって、おそらく「成分」というのはお書きになっている「次元」と同様の意味合いかと思います。カッコ内の数値については、成分の寄与率(次元の説明率と同意でしょうか)で間違いありません。> 2.テキストデータの対象を広げると「成分」が下がる傾向にあります。「成分」ではなく、「成分の寄与率」のこととしてお答えさせていただきます。これは一般的な傾向だと思います。対応分析では、2元のデータ表を入力データとして解析が行われます。この入力となるデータ表が大きくなるほど、取り出せる成分の数が多くなりますので、1つの成分あたりの寄与率は小さくなっていくのが一般的です。こうしたことから、前述の「対応分析法・数量化法III類の考え方.pdf」(58ページ目・141)においても「一般にこの種のデータ表の対応分析で得られる固有値(とその寄与率)は,値が小さくあたかも寄与が低いように見えるがそれはデータ表の構造的な制約から生じるものである」と解説されているものと思います。そうした値ですので、テキスト型データを分析する場合には寄与率が数%ということもめずらしくありません。ある種の参考程度にこの値をご覧になることをお勧めいたします。以上、ご参考になりましたら幸いです。
迅速かつ丁寧なご回答ありがとうございます。おかげさまで何となく理解していた分析の特徴が確かなものになりました。大変良いソフトウェアですので、今後とも知識を深めながら利用させていただきたいと思います。ありがとうございました。
こんにちは、樋口です。書き込みありがとうございます。いまだKH Coderは完成品という状態には程遠いため、まだまだ分かりにくい部分・使いにくい部分など残っているかと存じます。また何かご不明な点等ございましたら、お気軽に書き込みしていただけましたら幸いです。今後ともどうぞよろしくお願いいたします。