[掲示板へもどる]
一括表示

  [No.2374] クラスター分析に使う文書データ 投稿者:みや  投稿日:2016/01/28(Thu) 19:28:58

お世話になります。Khcorderを使い、クラスター分析をさせていただこうと考えております。
分析の前段階のところでよく分からない部分があり、質問をさせていただきました。

ある地域に対するイメージ(「どういうところだと思いますか?」)を尋ね、結果をデンドログラムに表したいと考えております。

回答者の多くは1つの観点からのみ理由を述べているのですが、何人かの回答者は、箇条書きで、2つ、3つの観点からそれぞれ理由を詳しく述べています(例えば、「第一に、○○なので○○な気候のところだと思う。第二に、△△な理由で△△な人たちが住んでいると思う」という感じで書いてくれています)。

上記の記述を1文書として分析してしまうと、○○のところで出てきた語と、△△のところに出てきた語の共起性を分析していることになってしまうので、分析結果が歪んでしまうのかなと思ったのですが、そういった認識であっていますでしょうか?(○○と△△は互いに別の観点であり関係が無い話なので、同一回答者ではあっても1文書にしてしまうのはおかしいのかなと思いました)
もしそうだとすると、○○のところと、△△のところに文書を分けて(段落で分けるなどして、2つの文書として)分析するべきなのでしょうか?

あるいは、○○も△△も含めた1つの文書として分析してしまっても、クラスタの分類結果に影響はないのでしょうか?

ソフトと言うよりクラスター分析の質問になってしまい申し訳ありません。
もしもお差し支え無ければ、ぜひご教示いただけますと大変ありがたいです。

どうぞよろしくお願いいたします。


  [No.2375] Re: クラスター分析に使う文書データ 投稿者:HIGUCHI Koichi  投稿日:2016/01/28(Thu) 22:34:04

こんにちは、樋口です。書き込みありがとうございます。

「○○を気にする人は、△△についても気にする傾向がある」ということが、
クラスター分析の結果に反映されるものと思います。デンドログラム上で○○
に関する語のグループと、△△に関する語のグループが比較的近くにきたりと
いったことが起こりうるでしょうか。

私自身は、それがまずいことだとはあまり思いませんが、分析の目的上好まし
くないという場合には○○のところと△△のところに分けて、ということにな
るでしょうか。

分析結果も見ながら検討されると良いかと思います。


  [No.2376] Re: クラスター分析に使う文書データ 投稿者:みや  投稿日:2016/01/29(Fri) 01:41:00

樋口先生

さっそくのお返事ありがとうございます。

> 「○○を気にする人は、△△についても気にする傾向がある」ということが、
> クラスター分析の結果に反映されるものと思います。デンドログラム上で○○
> に関する語のグループと、△△に関する語のグループが比較的近くにきたりと
> いったことが起こりうるでしょうか。

この傾向は、

・抽出語→ 階層的クラスター分析
・文書→ クラスター分析
・コーディング→ 階層的クラスター分析

のいずれのパターンでも起こり得る、ということでよろしかったでしょうか?

ところで、文書を対象とした場合のみ「階層的」がついておりませんが、これには何か理由がありましたでしょうか?

どうぞよろしくお願いいたします。


  [No.2401] Re: クラスター分析に使う文書データ 投稿者:みや  投稿日:2016/02/06(Sat) 09:46:21

樋口先生

お世話になっております。
下記についてですが、もしもお差し支え無ければ、お手すきの時にでもぜひご教示を賜れればありがたく存じます。
(掲示板の趣旨にそぐわない質問になってしまっておりましたら、大変申し訳ありません。)


> 樋口先生
>
> さっそくのお返事ありがとうございます。
>
> > 「○○を気にする人は、△△についても気にする傾向がある」ということが、
> > クラスター分析の結果に反映されるものと思います。デンドログラム上で○○
> > に関する語のグループと、△△に関する語のグループが比較的近くにきたりと
> > いったことが起こりうるでしょうか。
>
> この傾向は、
>
> ・抽出語→ 階層的クラスター分析
> ・文書→ クラスター分析
> ・コーディング→ 階層的クラスター分析
>
> のいずれのパターンでも起こり得る、ということでよろしかったでしょうか?
>
> ところで、文書を対象とした場合のみ「階層的」がついておりませんが、これには何か理由がありましたでしょうか?
>
> どうぞよろしくお願いいたします。


  [No.2402] Re: クラスター分析に使う文書データ 投稿者:HIGUCHI Koichi  投稿日:2016/02/06(Sat) 12:22:42

こんにちは、樋口です。書き込みありがとうございます。

気がつかなくて、返信が遅れてしまい失礼いたしました。

> この傾向は、
>
> ・抽出語→ 階層的クラスター分析
> ・文書→ クラスター分析
> ・コーディング→ 階層的クラスター分析
>
> のいずれのパターンでも起こり得る、ということでよろしかったでしょうか?

はい、そうなります。

> ところで、文書を対象とした場合のみ「階層的」がついておりませんが、これには何か理由がありましたでしょうか?

クラスター分析には様々な手法があります。文書の分析の画面では「階層的」でないクラスター分析の手法(CLARA)も選択できるため、このような形になっています。


  [No.2403] Re: クラスター分析に使う文書データ 投稿者:みや  投稿日:2016/02/06(Sat) 17:18:40

樋口先生

さっそくお返事くださりありがとうございました。