[掲示板へもどる]
一括表示

  [No.1968] 対応分析におけるはずれ値の扱いについて 投稿者:永井  投稿日:2015/02/14(Sat) 18:56:57

先日は丁寧に解説していただきありがとうございました。

今回は、対応分析のはずれ値の扱いを論文でどう記述するべきか悩んでおりまして質問させていただきます。

現在の状況を書かせていただきます。

1.新聞記事の高頻出語から研究テーマにそくした語を指定し対応分析を行った
2.研究テーマ上重要と考えられる語Aが明らかにはずれ値としてプロットされた
3.はずれ値語Aのデータを除外し、再度、対応分析を行った
4.語の布置とタグに設定した年の布置が解釈しやすくなった
5.4の結果を論文としてまとめている

という状況です。
しかし、語Aが研究テーマ上、重要な語であり、除外する際には明確な根拠を示す必要があると考えました。

そこで大隈先生の対応分析の資料などを拝見し、下記のような点をあげて除外する根拠として提示しようと考えています。

●語Aを除外する根拠
1.語Aがはずれ値であること
2.追加的処理(supplementary treatment)を行う。分析データに語Aを入れた布置図と除外した布置図を比較
3.比較から語と年の変化を記述
4.この変化についての解釈と考察を一応加える
5.語Aは3のような変化を及ぼすが、語Aを入れることでほかの語が中心にまとまり全体が解釈しにくくなる
6.語Aを除外した対応分析の布置図を今回の結果として示す。


以上が、根拠に関する部分の構成です。

お聞きしたいのは、
(1)このような説明で除外する根拠として適切なのか。

(2)論文にこれらの根拠を記述する場合、どこで記述するほうがよいのか(分析に使用する語の選択理由の部分か、分析結果の部分か、考察の部分か)

の2点です。
KHcoderそのものに関する質問ではありませんが、よろしくお願いいたします。


  [No.1972] Re: 対応分析におけるはずれ値の扱いについて 投稿者:HIGUCHI Koichi  投稿日:2015/02/21(Sat) 23:51:05

こんにちは、樋口です。書き込みありがとうございます。

お書きいただいた内容で問題ないと思いますし、私であれば分析結果を示す箇
所に注を入れるのではないかと思います。

ただ、説明が結構大変ですよね。

別の考えられる方法としては、語Aを分析から除くのではなくて、(a-1)プロッ
トの全体像(通常のプロット)と、(a-2)中心部分を切り出して拡大したプロ
ットの2種類を示すという方法があるでしょう。この方法であれば、少し説明
が楽になるかもしれません。

あるいは、中心部分を切り出すのではなくて、(b)中心部分が大きく表示され
るような変換をかけるという方法もあるでしょう。これだと、語Aが端っこの
方に表示され続ける一方で、中心部も大きく表示されます。(拡大のための具
体的な変換法/関数までは分からないのですが)大隅先生のWordMinerにはこ
の機能があります。

aにせよbにせよ、Rあるいは他のソフトでプロットを作り直さなければなりま
せんが、一方で論文での説明は楽になるかもしれません。ご参考までに。


  [No.1976] Re: 対応分析におけるはずれ値の扱いについて 投稿者:永井  投稿日:2015/02/23(Mon) 14:08:45

樋口さん

いつも丁寧にご回答いただきありがとうございます。

とりあえず、分析結果に注を入れる方法で進めようと思います。
注がかなり長くなってしまいますが。

はずれ値の語を外さず、図の調整で見やすくする方法は非常に参考になりました。ありがとうございます。

今後も度々質問すると思いますが、よろしくお願いいたします。