先日は丁寧に解説していただきありがとうございました。
今回は、対応分析のはずれ値の扱いを論文でどう記述するべきか悩んでおりまして質問させていただきます。
現在の状況を書かせていただきます。
1.新聞記事の高頻出語から研究テーマにそくした語を指定し対応分析を行った
2.研究テーマ上重要と考えられる語Aが明らかにはずれ値としてプロットされた
3.はずれ値語Aのデータを除外し、再度、対応分析を行った
4.語の布置とタグに設定した年の布置が解釈しやすくなった
5.4の結果を論文としてまとめている
という状況です。
しかし、語Aが研究テーマ上、重要な語であり、除外する際には明確な根拠を示す必要があると考えました。
そこで大隈先生の対応分析の資料などを拝見し、下記のような点をあげて除外する根拠として提示しようと考えています。
●語Aを除外する根拠
1.語Aがはずれ値であること
2.追加的処理(supplementary treatment)を行う。分析データに語Aを入れた布置図と除外した布置図を比較
3.比較から語と年の変化を記述
4.この変化についての解釈と考察を一応加える
5.語Aは3のような変化を及ぼすが、語Aを入れることでほかの語が中心にまとまり全体が解釈しにくくなる
6.語Aを除外した対応分析の布置図を今回の結果として示す。
以上が、根拠に関する部分の構成です。
お聞きしたいのは、
(1)このような説明で除外する根拠として適切なのか。
(2)論文にこれらの根拠を記述する場合、どこで記述するほうがよいのか(分析に使用する語の選択理由の部分か、分析結果の部分か、考察の部分か)
の2点です。
KHcoderそのものに関する質問ではありませんが、よろしくお願いいたします。