Re: テキストではなく、2値変数がたくさんあるデータの分析 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.2955] Re: テキストではなく、2値変数がたくさんあるデータの分析 投稿者:HIGUCHI Koichi  投稿日:2017/04/12(Wed) 01:19:22

こんにちは、樋口です。書き込みありがとうございます。

■データの様子
> 手元にある「0」「1」のデータのみを使って分析が出来ないかと
> 思ったのですが。

テキストではなく、「0」と「1」が値として入力されたデータだけを分析され
たい場合には、KH Coderではなくて、数値データ向けの統計ソフトが適してい
ようかと思います。

それでもぜひKH Coderで分析を、という場合は、以下のような方策が考えられ
ます。

> 「0」「1」のデータはテキストから作成したもの
> ではなく,イメージ調査であてはまると「1」,あてはまらなければ「0」
> というデータになります。

1つのイメージについて、1つの列に「0」と「1」の2値変数(ダミー変数)で、
「あてはまる=1」か「あてはまらない=0」かが入力されているというデータ
ですね。イメージが50あれば、50列に渡ってデータが入力されている。そして、
テキストの列はもともと存在しない。

■1つ目の方法
この場合は、KH Coderで分析する1つの方法は、テキストの列をお作りいただく
ことだと思います。「0」は削除して、「1」は「<イメージA>」といった文字列
に置換します。そして1列につなげれば、KH Coderで分析できるでしょう。

そのつなげた列は以下のようなものになるでしょう。
----------------------------------------------
<イメージA><イメージB>
<イメージC>
<イメージB><イメージC>
<イメージA><イメージB><イメージC><イメージD>
<イメージB><イメージC>
----------------------------------------------

プロジェクト作成時に、この列を「分析する列」として指定します。
この方法ならばそれぞれのイメージをKH Coder上で「語」として扱えるので、
出現数の多いものだけを分析に用いたり、といった「語」としての操作を行えま
す。

※上記のように山カッコ「<>」で括っておけば、「イメージA」「イメージB」な
どが必ず1つの語として抽出されます。

■2つ目の方法
テキストの列としてはまったくのダミーとして、「あ」「い」など、何らかの
テキストを入力しておきます。特に内容に意味などなくてOKです。そのダミー列
を「分析対象とする列」として指定します。また前処理を行います。

次に、各イメージの列名(変数名)を使って、KH Coder上でコーディングを行い
ます。

------------------------------
*イメージA
<>イメージA-->1

*イメージB
<>イメージB-->1

*イメージC
<>イメージC-->1
------------------------------

こうすれば、各イメージをKH Coder上で「コード」として分析できるようにな
ります。

この方法だと、「出現数の多いものだけを分析に含める」といった、「語」な
ら使える機能が使えなくなります。そういう若干の不便さはありますが、
「コード」を使っての共起ネットワーク作成や、対応分析等は行えます。


■お礼
こうした方法を使えば、テキストデータでなくても、2値変数がたくさんある
場合はKH Coderで分析できますね。当初、そういうことに、まったく思い至
りませんでした。そのため、当初の対応がトンチンカンになってしまって
申し訳ありません。また、ここまでしてKH Coderを分析にお使いいただけるこ
とは光栄です。

そして、貴重なデータを拝見させていただきまして大変ありがとうございまし
た。おかげさまでバグを1つ修正することができました。現在公開している最
新アルファ版では、対応分析もエラーにならないと思いますので、お試しくだ
さい。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)