[掲示板へもどる]
一括表示

  [No.496] コーディングルールの抽出について 投稿者:森田@京都  投稿日:2009/08/31(Mon) 19:33:37

樋口様

いろいろお教えいただき、ありがとうございます。
先の質問に関しては、いただいたご指示にまだ対応できていないのですが、たびたび質問いたします。

コーディングルールに関してです。
テキスト群から、コーディングルールを抽出する作業を、
KHcoderを使って行うことは、できないでしょうか。

先生の「計量テキスト分析の方法と実践」を拝見しています。
こちらの第4章で、新聞記事のデータベースをつかった分析をされており、出現パターンの似通った言葉ほど近くに布置されるマップを、
多変量解析によって作成されていますが、ここで、viscovery SOMine Plusというソフトを使われています。
その結果見いだされた14のクラスターをもとに、コーディングルールを設定していらっしゃいます。

コーディングルールをどのようにするか悩んでおり、また、
KHcoderに、クラスター分析の機能があり、これをどのように利用したらその次のステップに活用できるのか、よくわからずにいます。

いま、工場で働く人や関与者に対しての自由記述の調査を
KHcoderで分析できるかどうか、研究しています。
質問は「基本とはなにか」というもので、熟語レベルで出てくるワードは、かなり一般的な語が多いので(確認とか、相談など・・・)、ひょっとしたら計量的な分析では、扱いがむずかしいのではないか・・・とも感じています。
ただし、うまくコーディングルールが設定できれば、なんらかの
特質が見いだせるのでは・・・とも思っています。

長くなって申し訳ございません。
何かご教示いただけましたら、幸甚です。


森田@京都


  [No.497] Re: コーディングルールの抽出について 投稿者:HIGUCHI Koichi  投稿日:2009/08/31(Mon) 23:25:32

こんにちは、樋口です。お書きいただいたご質問の意味が理解できているかど
うか、おぼつかない部分もありますので、的外れになってしまうかもしれませ
んが、以下簡単に書かせていただきます。

(チュートリアルをフォローしていただいていると仮定して書かせていただき
ますが、)漱石「こころ」のチュートリアルでは、コーディングルールを作成
することで、例えば「人の死」といった概念を取り出して分析を行っています。

ご質問の趣旨は、「いったいどうすれば、この『人の死』のようなものを見つ
けられるのか」あるいは「どうすれば分析に役立つ「人の死」のような概念を
見つけて、それをコーディングによって取り出せるのか」ということでしょう
か?
(もし違っていたら本当にすみません。以下はすべて無視して下さい)


こうした問題、すなわち、いかにして分析概念を見つけるかという問題には、
残念ながら簡単な答えは見あたりません。簡単な答えがないために、質的研究
の分厚い本がたくさん出ているのだと思います。

簡単な答えは無いのですが、この問題に取り組むには、大きく分けて、2つの
方向からのアプローチを交互に行うのが良いだろうと、個人的には考えていま
す。1つは(a)データを見ることで、データの中から、分析概念を見つけ出そ
うとする方向です。もう1つは、(b)当該分野の理論や先行研究から、何が分
析概念となるかを考えだそうとする方向です。

(a)の方に関しては、計量的な方法でデータを探索する手法として、KH Code
rにはいくつかの機能が備わっています。(a1)まず、データ中にどんな概念
が含まれていそうかを探るためのものとして、頻出語150語の表/クラスター
分析/多次元尺度法/共起ネットワークなどがあります。例えばクラスター分
析で、「手紙」「返事」「出す」のような言葉がクラスターを形成していれば、
「*手紙のやり取り」のような概念がデータに含まれていたことを読み取れる
でしょう。

また、(a2)外部変数を用いた探索も重要です。例えば、管理職と非管理職を
比べれば、特に管理職の回答に多く出現する言葉があるかもしれません。そこ
からは、管理職に特徴的な概念を読み取ることができるでしょう。管理職/非
管理職に限らず、さまざまな外部変数を用いて、こうした比較を行うことがで
きます。こうした比較のための機能としては、関連語探索や対応分析が使える
でしょう。

以上のような多変量解析によって、場合によっては、分析の目的がある程度達
成されてしまう場合もあるでしょう。その一方で、多変量解析でおぼろげに見
えてきたものを、コーディングによって取り出して、さらに分析を進めること
で、発見が得られる場合もあるでしょう。

仮にコーディングを行うとすると、(a1)や(a2)の分析によって見えてきた
様々な概念の中で、どれに注目してコーディングを行うのかという問題が出て
きます。ここで重要なこととして、順不同で書きますが、1つには(b)の方向
からのアプローチがあると思います。「なんらかの特質が見いだせるのでは・
・・」という方向で考えるだけでなく、「どんな特質が見いだせればおもしろ
いだろうか?」という方向からも考えてみることです。つまり、データだけを
見るのではなく、理論的な方向からも見ると言うことです。

また、データが手元にある場合には、実際にあれこれ試してみることも重要で
す。様々なコーディングルールを実際に作って集計し、上手くいくものを探す
ということです。ここで言う「上手くいく」というのが、どういうことかは、
分析の目的に依存します。例えば、管理職と非管理職の間で差が出るのが「上
手くいく」ということかもしれません。あるいは、「確認」と「相談」のうち
片方だけに関連するコードが見つかることが「上手くいく」ということかもし
れません。これはまったくもって分析の目的次第です。日常的な用語としては、
「試行錯誤」には悪いイメージがあるかもしれません。しかしデータ分析にお
いては、非常に重要なことだと思います。もちろん、やみくもな試行錯誤は消
耗するだけですが、「コーディングルールを作って特定の集計を試す」といっ
たある程度決まった手順の中で試行錯誤することは、意義のあることだと考え
ています。

結局、分析概念を見付けるために役立ちそうなことは(順不同で)、
  ・多変量解析による探索
  ・理論的な考察
  ・コーディングの試行錯誤
ということになりますでしょうか。また、チュートリアルでも触れていますが、
多変量解析による探索や試行錯誤の際には、量的分析の意味するところを、常
に原文にあたって確認しつつ進めることも重要でしょう。「王道」は見あたり
ませんので、1つ1つ分析を行い、1つ1つの結果を解釈していくことで、データ
への理解と洞察を少しずつ着実に積み重ねることが、「急がばまわれ」につな
がろうかと思います。


ともあれ、コーディングルールを新たにおこそうとする作業には、常に悩みや
試行錯誤が伴うものだと思います。そういうものだと思って頑張っていただく
ということが、もしかしたら一番大切なことかもしれません。さもなくば、質
問内容や外部変数を工夫することで、多変量解析によって少なくともある程度
は分析の目的が達成されるような設計を目指すのも一手でしょう。すなわち、
コーディングルールを作らなくても済む分析を考えると言うことです。あるい
は、先行研究や理論仮説を参考にしてコーディングルールを作成できると、0
からの作成よりはずいぶん楽になるでしょう。

とりとめもなくなってしまいましたが、部分的にでも、ご参考にしていただけ
る部分がありましたら幸いです。


  [No.506] Re: コーディングルールの抽出について 投稿者:森田@京都  投稿日:2009/09/02(Wed) 13:29:09

樋口様

わかりにくい質問に、的確かつ丁寧にお答えいただき、とても感謝しています。
いただいた助言をもとに、試行錯誤をしてみます。
ありがとうございました。お礼まで。

森田@京都