Re: 出現頻度の比較 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1270] Re: 出現頻度の比較 投稿者:HIGUCHI Koichi  投稿日:2013/01/08(Tue) 01:19:33

こんにちは、樋口です。書き込みありがとうございます。

> 共起ネットワークの図で見ればわかることなのかもしれませんが、
> あくまで数値的に比べる方法がないかと考えています。

そうしたご主旨でしたら、お書きいただきました通り、コーディング・ルール
をつくってクロス集計という方法が良いかと存じます。

おそらく、共起ネットワークで男性に特徴的な語については、クロス集計でも
男性に多く出現しているでしょう。また共起ネットワークで男女に共通して出
てきた語については、クロス集計でも男女の頻度がそれほど大きく変らないと
予想できます。

※と、予想はできます。しかし、多変量解析/共起ネットワークに頼り切るの
ではなく、生の頻度でも確認というのは非常に良いことだと思います。「生の
頻度がこれくらい違うと、多変量解析/共起ネットワークにはこのように表現
されるのか」といった感覚を掴めば、解釈も行いやすくなります。

なお、コーディングのクロス集計では1回2回という出現頻度ではなく、その語
を使っている女性が何人いたかという人数のカウントになります。

> カイ2乗値の意味

この値にアスタリスク「*」がついていますと、「統計学的に有意」というこ
とになります。無理矢理一言で申しますと、そのコードの男女間の差は、偶然
の範囲の差ではなく、確かに差があったようだということです。

一般的なクロス表のカイ2乗検定と同じものです。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=872&mode=allread

無理矢理一言にしたものではなく、カイ2乗検定についての正確な説明として
は、以下のような書籍をご覧下さい。

> 土田昭司・山川栄樹 2011 『新・社会調査のためのデータ分析入門――実証
> 科学への招待』 有斐閣


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)