[掲示板へもどる]
一括表示

  [No.999] 解析対象テキストが関連する2つの場合は? 投稿者:川口  投稿日:2012/07/08(Sun) 23:05:10

お世話様です。アンケートの解析にKH Corderを適用したいと考えていますが、未だ的確なイメージを掴めずにおります。初心者質問で恐縮ですが、アドバイスを頂戴できれば嬉しいです。

<アンケート項目>
 1)年代(10代、20代、30代、40代、50代、60代、70代以上)
 2)性別(男or女)
 3)問題点(自由回答)
 4)3)の問題点解決に向けた提案(自由回答)

<解析ポイント>
 A)問題点と解決に向けた提案の対応分析
 B)年代別と性別での共起ネットワーク

<教えて頂きたい事項>
 年代と性別については外部変数を利用し、これと問題点、あるいは
解決に向けた提案についての対応分析は、マニュアルを見ながら、一応の流れは実践できました。
 しかしながら、今回のように解析対象テキストが関連する2つの場合に、テキストマイニング対象とするテキストファイルをどのように整形して、KH Corderの入力データとするのが望ましいのでしょう?

 初心者質問で恐縮ですが、よろしくお願い申し上げます。


  [No.1000] Re: 2種類の自由記述の関連を分析するには 投稿者:HIGUCHI Koichi  投稿日:2012/07/09(Mon) 00:23:01

こんにちは、樋口です。書き込みありがとうございます。

> A)問題点と解決に向けた提案の対応分析

お書きいただいた場合のように、2種類以上の自由記述がある場合の分析につ
いては、残念ながらあまり自動化・システム化されていません。そのため、
分析手順はやや煩雑になってしまうと思います。

まず、「問題点」と「解決提案」とを別々のプロジェクトとしてKH Coderに登
録します。ただし、両方のプロジェクトのケース数が一致するように注意して
ください。KH Coderは空行を「存在しないもの」と見なしますので、自由記述
に欠損値が含まれるケースを削除しておくか、あるいは欠損値として「.」を
入力しておくといった対処が必要になります。

そして、片方の自由記述、今回のケースであれば「問題点」をおおむね10〜20
種類程度に分類すると良いでしょう。クラスター分析・コーディングルール・
ベイズ学習による分類など、どの方法を用いてもかまいません。分析手順に慣
れるために最初に試す方法としては、クラスター分析が手軽で良いかと思いま
す。分類結果(外部変数)をCSVファイルに出力しておきます。

次に、もう片方の自由記述「解決提案」のプロジェクトをKH Coderで開き、先
ほどの分類結果を外部変数として読み込みます。そして、「問題点」の分類結
果変数と、「解決提案」の抽出語との対応分析を行うと良いでしょう。


  [No.1001] Re: 一部の回答だけを用いた共起ネットワークを作成するには 投稿者:HIGUCHI Koichi  投稿日:2012/07/09(Mon) 00:28:02

こんにちは、樋口です。書き込みありがとうございます。

> B)年代別と性別での共起ネットワーク

これについては、(1)上で作成した2つのプロジェクトに、性別・年代などの外
部変数を読み込む方法が1つです。そして「ツール」「外部変数と見出し」「
リスト」とたどり、「性別」変数の値「男性」を選択(クリック)します。こ
の状態で、「▽特徴語」「選択した値」をクリックすると、「関連語探索」画
面が開き、「男性」の回答に特徴的な語が検索されます。この画面右下の「共
起ネット」ボタンをクリックすると、これらの語を使った共起ネットワークが
作成されます。また共起の計算は「男性」の回答のみを用いて行われます。

この方法の注意点として、関連語探索の「フィルタ設定」を調整することであ
まり頻度の低い語が入らないようにすると良いでしょう。

あるいは、(2)単に男性のみの回答を集めたテキストファイルや、20代の回答
のみを集めたテキストファイルをお作りいただき、プロジェクトとしてKH Coder
に登録し、共起ネットワークを作成するのも1つの方法です。

(1)の方法では、全体と比べて「男性」の回答に高い確率で出現する語、すな
わち男性に特徴的な語が選択されます。それに対して(2)の方法では、単に「
男性」の回答中に多く出現する語(女性の回答にも同様に多く出現しているか
もしれない語)が選択されます。

どちらかというと(1)がお勧めですが、データによっては(2)の方が結果を解釈
しやすい場合があるかもしれません。また(1)では「フィルタ設定」の微調整
を行った方が良い場合が多いのに対して、(2)ではそうした調整の必要が無い
ので、手順としては容易でしょう。

なお上記は、「問題点」と「解決提案」とで別々に共起ネットワークを作成す
る場合の手順です。「問題点」と「解決提案」とを併合して共起ネットワーク
を作成する場合、これら2つを併合したテキストファイルを作成して、プロジ
ェクトとしてKH Coderに登録していただく必要があります。


  [No.1002] Re: 一部の回答だけを用いた共起ネットワークを作成するには 投稿者:川口  投稿日:2012/07/09(Mon) 21:40:59

樋口先生

 早速に、判りやすい回答をありがとうございました。
解析作業を具体的にイメージすることができました。嬉しいです。

 現在、
>「問題点」の分類結果変数と、「解決提案」の抽出語との対応分析
に取り組んでおります。
 共起ネットワークについては、前述の対応分析の結果を使って、
教えて頂いた2つの方法で、その結果を比較してみたいと思います。

 取り急ぎ、御礼まで。今後ともよろしくお願い申し上げます。