計量社会学受講しています吉澤です。プリントでは章・節・段落ごとのコーディングを行う際、集計単位をH1にしたりH2にする指示があるのですが、コーディング単位を段落にすると集計単位が選択出来なくて困っています。コーディング単位を文にすると集計単位で段落を選択出来るので、集計結果は出てくるのですが、何か違いますよね?ちなみに、青空文庫から取ってきた「人間失格」を使っています。
こんにちは、樋口です。書き込みありがとうございます。漱石「こころ」のデータでは、> <h1>上_先生と私</h1>というように、上・中・下といった部の見出しがh1のタグで括られていました。そのおかげで、h1ごと(すなわち上・中・下といった部ごと)の集計が行えたのです。同じようなことを行うためには、『人間失格』データにも<h1>のようなタグを入力する必要があります。「はしがき」「第一の手記」といった見出しをh1タグで括ってやると良いでしょう。例えばですが、こうしたファイルを作ると良いでしょう。これなら、「こころ」同様にh1単位の集計ができるはずです。http://khcoder.info/psnl/tmp/ningen_shikkaku.txtリンクを右クリックして「リンク先をファイルに保存」等を選択すると保存できると思います。内容を確認の上で、このファイルをそのまま使ってもらっても結構です。「h1」で検索してみると、見出しを括っているのが確認しやすいでしょう。ともあれ、『人間失格』とは、なかなか味わいのあるデータですね。量的な分析をほどこすことで、何か新たに気づきが得られるのかどうか、楽しみなところです。
樋口先生ありがとうございます。上手いこといきました(^^)でもやっぱりコーディング難しいですね・・・。
樋口です。そうですね、コーディングは簡単ではないと思います。とりあえず、頻出150語の表とか、共起ネットワークをつくってみましょう。あと、h1タグを追加したので、対応分析を使って「こころ」の上・中・下の特徴を見たのと同じことができるはずです。すなわち、対応分析で、それぞれの部分の特徴を見れるはずです。こうした分析から読み取れることをまとめてもらえれば、レポートとしてはひとまずOKです。コーディングは、プラスアルファと考えてもらうと良いでしょう。それでは頑張って下さい。