[掲示板へもどる]
一括表示

  [No.599] 対応分析の布置図におけるタグの位置 投稿者:神戸のけんちゃん  投稿日:2010/02/12(Fri) 18:41:11

KH Coderでは御世話になっております。フリーでこのようなソフトを提供して下さり、非常に感謝しております。本日は、対応分析で出力する布置図にプロットされる、タグの位置についてお尋ねします。

データは、一人の政治家の発言を集めたもので、KH Coderでの分析を考えて半年ごとにHTMLタグを付けました。その中で言及された人名を抽出し、それぞれが出現した時期によるパターン分けをする目的で対応分析を使いました。対応分析のオプションで「見出しまたは文書番号を同時付置」を指定すると、タグを付けた半年ごとの期間が人名と一緒に布置されます。

分からないのは、このタグが布置された位置をどのように解釈すればよいのかです。対応分析では、パターンが似たものは近くに布置され、全体的に生起頻度が高かった項目は原点近くに布置されると理解しております。タグの周囲にはその期間によく出現した人名が分布しておりますが、タグの位置自体はどのように解釈したらよいのでしょうか。周囲の項目の平均値ではもちろんないでしょうし、他項目と同様に扱われるのだとしたら、実際の計算ではどのような扱いになっているのかが分かりません。

対応分析の経験が浅いため、つまらぬ質問になってしまいました。御教示下されば幸甚です。

なお、蛇足ながらKH Coderでの要望点を付け加えれば、この対応分析のプロット出力画面から、「保存」ではなく直接印刷できればなあと、何度か感じました。たいしたことではありませんし、使っていて格別な不便は感じておりません。


  [No.600] Re: 対応分析の布置図におけるタグの位置 投稿者:HIGUCHI Koichi  投稿日:2010/02/12(Fri) 22:23:46

こんにちは、樋口です。ご質問に加えて、ソフトウェアについての具体的なご
要望/アドバイスをいただきまして、まことにありがとうございます。

あまり上手くお答えできるかどうか確信が持てないのですが、いただいたご質
問について書かせていただきます。

お書きいただきました通り、出現パターンに何らかの似た特徴がある語は近く
に(原点から見て同じ方向に、そしてその特徴が色濃いほど原点から遠ざかり、
その特徴が弱いほど原点近くに)布置されます。

まったく同じことが時期(タグ)にもあてはまるとお考えいただけるはずです。
すなわち、どんな語を多く含むかというパターンが似ている時期(タグ)同士
は、原点から見て同じ方向に布置されます。

余談になるかもしれませんが、「同時布置」によって、この2つの布置を重ね
合わせて/対応させて見ることができるというのが、対応分析の良いところな
いしは「対応」分析と呼ばれるゆえんと理解しております。この仕組みによっ
て、ある時期Aに特に多く出現している語aは、原点から見て、時期Aと同方向
に布置されます。もし時期Aと時期Bとで語の出現傾向が似ていたなら、時期B
も、原点から見て時期Aと同方向に布置されるでしょう。したがって、時期ご
との語の特徴だけでなく、どの時期とどの時期の内容が似ていたのかというこ
とについても読み取れるのが、対応分析の特長と言えるでしょう。

実際の計算ということになりますと、テキスト・マイニング研究会(代表:大
隅昇先生)のサイトに、かなりまとまった解説があるかと思います。
http://wordminer.comquest.co.jp/wmtips/analysis.html
「対応分析法・数量化法III類の考え方.pdf」など

以上、多少なりともご参考になりましたら幸いです。
どうぞよろしくお願いいたします。


  [No.601] Re: 対応分析の布置図におけるタグの位置 投稿者:神戸のけんちゃん  投稿日:2010/02/13(Sat) 16:57:35

樋口先生、非常によく分かりました。同時付置というのが、
重ね合わせだということを見逃しておりました。当たり前の
ことですが、この一言でかなり疑問が解消されました。御教
示頂いたリンクの文書も読んでみますね。

ありがとうございました。