[掲示板へもどる]
一括表示

  [No.728] 項目間の関連を分析するためのデータ整形と手法 投稿者:Shoji Wataru  投稿日:2011/01/10(Mon) 23:02:54

東北大学の東海林です。連続投稿になりますがご容赦ください(前トピックの問題は無事解決いたしました)。

「慢性疾患に対する夫婦の取り組みと夫婦間の問題」に関する自由記述式のアンケートに関する分析を行うためにKH Coderを使用させていただいております。
今回のご質問は、データ整形と分析方法に関することです。

アンケート項目は全3項目(Q1-Q3)の自由記述式で、分析として、Q1とQ2のマッチングのしかた(回答者と配偶者の取り組み方のタイプ)と、Q3で得られる特徴(夫婦間で生じる問題)に関連がみられるかどうかを調べたいと思っております。
お聞きしたいのは、これを実行するためにどのようにデータを読み込ませるとスマートに(簡便に)分析できるか、というものです。

質問を具体的にするために、各質問項目の内容と、現在私が考えている分析手順を記しておきます。

自由記述の内容は以下の通りです。
Q1: 回答者自身の疾患への取り組み方に関する内容。
Q2: 配偶者(回答者の妻あるいは夫)の疾患への取り組み方に関する内容。
Q3: 疾患により生じる夫婦間の問題に関する内容。


<分析手順1>
Q1-Q3の回答をそれぞれ別のデータとしてKH Coderに読み込む。

<分析手順2>
自由記述回答を用いて、Q1-Q3についてキーワードからコード(ex."糖質・脂質への配慮"、"配偶者の無関心"、"ストレスによる夫婦間摩擦"など)をそれぞれ作成。

<分析手順3>
[コーディング結果の出力]を用いて、割り付けられたコード(ex."糖質・脂質への配慮"、"配偶者の無関心"、"ストレスによる夫婦間摩擦"など)に関する二値変数(0/1データ)を出力する。
(⇒これにより3種類の二値変数の出力データができる)

<手順4>
手順3で出力された3種類のデータをまとめて一つのデータとして統計ソフトに読み込み、数量化II類により予測式を検討する。


KH Coderのマニュアルには、H1からH5のタグには階層性があると書かれていたため、Q1-Q3の回答を一つのデータとしてまとめて入力するのを避けました。
理由は、例えばQ1に<h1></h1>、Q2に<h2></h2>、Q3に<h3></h3>を割り付けて、Q1のみの集計結果を表示させようとすると、階層性により、Q2やQ3も含まれて集計されてしまうと思われたためです。
…とは言うものの、タブに関するこの理解は正確でしょうか?

もし上記の分析手順以上にスマート(簡便?)なデータ整形のかたち、あるいは分析方法などがありましたらご教示いただけますと幸いです。
また、手順の問題点などありましたら、併せてご指摘いただけますと幸甚です。
よろしくお願いいたします。


  [No.729] Re: 項目間の関連を分析するためのデータ整形と手法 投稿者:HIGUCHI Koichi  投稿日:2011/01/12(Wed) 01:13:12

こんにちは、樋口です。書き込みありがとうございます。

お書きいただいたように、3つの別々のファイル/プロジェクトとしてKH Coder
に読み込んでいただくのが良いと思います。その際、無回答・欠損値が空行
になっていると、KH Coderはその行を無視してしまい(=ケース数が減り)、
3種類の自由記述の対応が取れなくなるのでご注意下さい。空行ではなく、
「.」ピリオド1文字などに変換しておくと良いでしょう。

以下のような形でHTMLタグの階層性を使えば、1つのファイルにまとめること
もまったく不可能というわけではありません。しかし、現状のKH Coderの仕様
では、3つの別々のファイルとして登録した方が分析しやすいと思います。
----------------------------------------------------------------------
<h1>回答者1</h1>
  <h2>設問1</h2>
    ・・・回答内容・・・
  <h2>設問2</h2>
    ・・・回答内容・・・
  <h2>設問3</h2>
    ・・・回答内容・・・
<h1>回答者2</h1>
  <h2>設問1</h2>
    ・・・回答内容・・・
----------------------------------------------------------------------

分析の手順も、まさにお書きいただいたような形になろうかと思います。

仮に私であれば以下のようにするかもしれませんが、あくまで微修正にすぎず、
基本的にはまったく同じです。

----------------------------------------------------------------------
■手順1
Q1-Q3の回答をそれぞれ別のデータとしてKH Coderに読み込む。その際、無回
答はピリオド1文字「.」等に変換しておく。

■手順2'
Q1とQ2について、頻出語リストやクラスター分析・MDS等を使ってキーワード
を確認し、コーディングルールを作成する。

■手順3'
「コーディング結果の出力」を行い、コードに関する2値変数を出力する。

■手順4'
ExcelやSPSSなどを使って、複数の2値変数を1種類のカテゴリー変数に変換す
る。値が1なら「糖質・脂質への配慮」、2なら「運動習慣」、3なら「生活リ
ズム」といった、多値カテゴリー変数にまとめてしまう。これによってQ1で1
つ、Q2でもう1つ、あわせて2つのカテゴリー変数を作成。

※細かく区分したり、大きくまとめたりといったバリエーションを作成して、
Q1で2〜3種類、Q2で2〜3種類のカテゴリー変数を作っても良いかもしれません。

■手順5'
Q3のファイルを登録したKH Coderのプロジェクトに、外部変数として上記2つ(?)
のカテゴリー変数を読み込みます。そして、抽出語の対応分析や「関連語探
索」を使い、上記2つのカテゴリー変数の値によって、いかにQ3の回答が変化
するかを観察します。

※ここまでで分析が完了する場合もあると思います。

■手順6'
ここまでの分析結果を参考にしつつ、必要に応じて、Q3についてもコーディン
グルールを作成します。そして「コーディング結果の出力」を行い、Q1・Q2の
コーディング結果とあわせて統計ソフトウェア上で分析を行います。
----------------------------------------------------------------------

以上、あくまで「私だったら」という手順ですし、お書きいただいた手順と基
本的には同様のものです。違いはかなり微妙で、もはや好みの違いくらいかも
しれません。多少なりともご参考になりましたら幸いです。


  [No.730] Re: 項目間の関連を分析するためのデータ整形と手法 投稿者:Shoji Wataru  投稿日:2011/01/12(Wed) 03:33:20

樋口先生、度々、ご丁寧にありがとうございます。

やはり別個のプロジェクトとして扱うのがベターなようですね。
手順5の「再度、Q1,Q2のコードに関する変数を外部変数としてKH Coderに読み込ませる」という手法は考えておりませんでしたので、参考にさせていただきたいと思います。

確かにこれによって、Q1,Q2で抽出したカテゴリーとQ3の回答の関連をよりダイレクトに検討できますね。
Q3のコーディングが必要ないという結論も、十分にあり得ることだと思いますし。

欠損データに関する処理につきましても大変参考になりました。

分析の可能性を広げていただき誠にありがとうございます。
アドバイスを参考にして分析してみようと思います。


  [No.731] Re: 項目間の関連を分析するためのデータ整形と手法 投稿者:HIGUCHI Koichi  投稿日:2011/01/12(Wed) 15:56:13

こんにちは、樋口です。書き込みありがとうございます。

実のところ、複数の自由記述項目を上手く扱う機能が欠けているという認識は
持っているのですが、どんな機能を付け加えたものかいまひとつ構想を持てず
にいるというような状況です。すぐには実現できないかもしれませんが、「こ
んな機能があれば」といったリクエストやお気づきの点等、お寄せいただけま
したら幸甚です。

なお、少し上の手順について補足ですが、「■手順3'」で出力したQ1とQ2の2
値変数群と、Q3のプロジェクトから出力した「文書x抽出語」表を結合し、統
計ソフトウェア上で多重対応分析を行うという手もあるかもしれません。
(多重対応分析はほとんど経験がないのであまり確信は無いのですが…)
もしこれが可能であれば、「■手順4'」で多値カテゴリー変数にまとめる手間
が省けるかと思います。

ともあれ、ご研究の進展を祈念いたします。また何かございましたらお気軽に
書き込みされて下さい。


  [No.732] Re: 項目間の関連を分析するためのデータ整形と手法 投稿者:Shoji Wataru  投稿日:2011/01/14(Fri) 13:27:20

樋口先生、ありがとうございます。

不勉強で対応分析や多重対応分析に慣れていないため学習が必要ですが、色々なサイトを見ていたらやれそうな気がしてきました。
選択肢の一つとしてとても参考になります。ありがとうございます。

個人的には、今回の分析のように、文章に含まれる階層構造タブが適用できない並列の(同レベルの)関係にある質問項目の関連についてKH Coder内で検討できると非常に嬉しいです。

例えば、<h1></h1>と<h2></h2>というタブの階層性のルールを取り除き、単純に異なる種類の回答として扱ってくれる機能をもたせ、H1とH2の回答に割り振られたコード間の関連を検討できるようにする…などがあると便利だと思います。
また欲を出して、<h1></h1>を単なる見出しではなく回答自体(比較的長い文章)をそのまま囲めるようにして、H5以上のタブ(H6,H7,H8,…)をつけられる仕様にすると、多項目のアンケートにも応用できるかと思います。

プログラミングの知識などが全くない状態で要望のみお伝えしておりますので、大変無茶なことを言っているかもしれません。その際は申し訳ありません。

今後もKH Coderを使用させていただきたいと思っておりますので、運用している間に欲しい機能が思いついたら書き込ませていただきます。
今後ともよろしくお願いいたします。


  [No.733] Re: 項目間の関連を分析するためのデータ整形と手法 投稿者:HIGUCHI Koichi  投稿日:2011/01/14(Fri) 13:31:05

樋口です。丁寧にご返信いただき恐縮です。

今回はもちろんのこと、今後もご要望をお知らせいただければ
検討いたしますので、お気軽にご連絡いただけましたら幸いです。

今後ともどうぞよろしくお願いいたします。