[掲示板へもどる]
一括表示

  [No.2599] 対応分析について 投稿者:   投稿日:2016/09/12(Mon) 16:42:35

クラスター分析についてでは大変お世話になりました。
対応分析の解釈と作り方について質問です。
No.2501のように、朝日新聞と読売新聞で特徴語の分布を対応分析で
見るに辺り、このケースで成分1⇒読売新聞、成分2⇒朝日新聞でしょうか?
縦軸、横軸は何を表しているのでしょうか?
軸も指定できるとありますが、どのように指定すると有効的な分析ができるのでしょうか?
どこかに詳しい説明等あれば教えて下さい。


  [No.2600] Re: 対応分析について 投稿者:HIGUCHI Koichi  投稿日:2016/09/12(Mon) 17:23:31

こんにちは、樋口です。書き込みありがとうございます。

このあたりがご参考になりますでしょうか。
http://www.khcoder.info/cgi-bin/bbs_khn/khcf.cgi?list=&no=444&mode=allread&page=0#452

データ中からなんらかの特徴を取り出したものが「成分」で、それが縦軸とか
横軸になっています。No.453ないしはNo.1926のような形で、結果を読み取るの
がお勧めです。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=1912&mode=allread#1926


対応分析はKH Coderに固有のものではなく、広く使われている統計手法ですの
で、必要に応じて、さらにいろいろお調べいただくのがよいかと存じます。

英語なのですが、この本が私の知る限り一番詳しくてなおかつ分かりやすかっ
たです。 →Correspondence Analysis in Practice, Second Ed.
http://amzn.to/1s0Fu3v

この掲示板でご質問いただく際には、なるべく、ご自身のご理解なさった内容
を詳しくお書きいただいて、それが正しそうかどうかという形で書き込んでい
ただけると、返信が来やすいかと思います。※樋口だけでなく、他のユーザー
様からのご返信、もう少しあると良いんですけどね。樋口が早く返信しすぎで
しょうか(苦笑)。


  [No.2603] Re: 対応分析について 投稿者:   投稿日:2016/09/12(Mon) 21:50:06

樋口様、

御忙しい中ご返信ありがとうございます。
1.それでは、対応分析の図の中で、(言葉)プロットの集まり具合が図の中でずれるのは、
どんな解釈をすれば良いのでしょうか?(例えば、ある新聞は右上にいき、ある新聞は左下にいく)
言い方を変えて質問すると、成分の%は何を意味するのでしょうか?
あるいは1912の説明の通り、座標に正準相関係数をかけるなど、分布させる方法が違うだけでしょうか?

2.もう一つお聞きしたかったのですが、私の場合分析元データをEXCELのCVSで作っていますが、
分析対象が複数ある場合、同じシート状に複数分析テキストを並べてチュートリアルのパワーポイントの9ページ目にあるように、
<H1>○○という具合に、同じシート上で、分析したいテキストの”列”をタグで
書いてやったのですがうまくいきませんが、シートをやはり分けないとだめでしょうか?

宜しくお願い致します。






は、樋口です。書き込みありがとうございます。
>
> このあたりがご参考になりますでしょうか。
> http://www.khcoder.info/cgi-bin/bbs_khn/khcf.cgi?list=&no=444&mode=allread&page=0#452
>
> データ中からなんらかの特徴を取り出したものが「成分」で、それが縦軸とか
> 横軸になっています。No.453ないしはNo.1926のような形で、結果を読み取るの
> がお勧めです。
> http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=1912&mode=allread#1926
>
>
> 対応分析はKH Coderに固有のものではなく、広く使われている統計手法ですの
> で、必要に応じて、さらにいろいろお調べいただくのがよいかと存じます。
>
> 英語なのですが、この本が私の知る限り一番詳しくてなおかつ分かりやすかっ
> たです。 →Correspondence Analysis in Practice, Second Ed.
> http://amzn.to/1s0Fu3v
>
> この掲示板でご質問いただく際には、なるべく、ご自身のご理解なさった内容
> を詳しくお書きいただいて、それが正しそうかどうかという形で書き込んでい
> ただけると、返信が来やすいかと思います。※樋口だけでなく、他のユーザー
> 様からのご返信、もう少しあると良いんですけどね。樋口が早く返信しすぎで
> しょうか(苦笑)。


  [No.2604] Re: 対応分析について 投稿者:HIGUCHI Koichi  投稿日:2016/09/12(Mon) 22:25:08

こんにちは、樋口です。

さきほども少し書いたのですが、この掲示板で、KH Coderに固有のものではな
い、一般的な統計手法(今回は対応分析)に関するご質問をなさる場合は、次
の点にご留意ください。ご自身で可能な範囲でお調べいただき、またお考えい
ただき、そのご自身のご理解を「自分はこう考えているのだけど…」というふ
うに書き込むようにしてください。

その方が、返信しやいということもありますし、ご質問なさる方にとっても、
自分が知りたいと思っている点についての答えを得やすいでしょう。質問側か
らすれば的外れな返答をえるだけで終わらずにすみますし、返答側からすれば
時間と労力を無駄にせずにすむでしょう。

次回からは是非ご留意ください。

> 1.それでは、対応分析の図の中で、(言葉)プロットの集まり具合が図の
> 中でずれるのは、どんな解釈をすれば良いのでしょうか?(例えば、ある新
> 聞は右上にいき、ある新聞は左下にいく)

その2つの新聞は違う特徴を持っていたということになりましょう。それぞれの
新聞に特徴的な語があったのでしょう。

原点から見てA新聞側の語、それも原点から遠く離れている語ほど、A新聞に特
徴的な語と読み取ることができるでしょう。

> 言い方を変えて質問すると、成分の%は何を意味するのでしょうか?

パーセントの算出方法は、先ほどの文献をご覧下さい。
Correspondence Analysis in Practice, Second Ed.
http://amzn.to/1s0Fu3v

日本語だとこちらの本もあります。
『対応分析入門』
http://amzn.to/2cDedQ1

寄与率、またはイナーシャ(Inertia)の寄与率、イナーシャの割合といった
用語で説明されていると思います。

> EXCEL

Exceでのデータ作成については、こちらのURLの例とマニュアルのA.3.1節
をご覧下さい。
http://www.slideshare.net/khcoder/data-preparation-for-kh-coder

※サンプルのExcelファイルをtutorial_jp\data_preparation\mother_jp.xlsと
して添付しています。

ExcelのファイルではH1などのタグは使えません。隣接する列を「外部変数」と
して使う必要があります。シートを分ける必要はありません。KH Coderは最初
のシートのみしか読み込みません。


  [No.2607] Re: 対応分析について 投稿者:   投稿日:2016/09/13(Tue) 20:56:47

樋口様、

大変なアドバイス深謝いたします。
論文化の上、投稿する予定ですので、
良いご報告ができるよう頑張ります。
引続き宜しくお願い致します。