樋口先生
大変お世話になっております。
私は今、テキストマイニングを利用したある特定分野の研究系譜の探求を行っております。
お恥ずかしながら、初めてテキストマイニングを用いた分析を行っているため、傾向把握等が難しい現状にあります。
今回私が行った手順は、
1.特定の分野の学会誌に掲載されている「論文タイトル」及び「発行年」等を、初巻号から現巻号分収集する(1800件程)
2.KH Coderを用いて形態素解析を行う(データ:10年分毎に分割し、Projectを作成)
3.ツールより、各年代ごとに「抽出語リスト」及び「共起ネットワーク」を作成
4.元データより、論文掲載数の経年変化を表すグラフを作成。10年毎の頻出語と比較し、その分野の歴史などと照らし合わせて、各年代での研究の潮流や傾向を把握する
と、このような流れで進めてきました。
テキストマイニング後のデータ(抽出語リストや共起ネットワークなど)は客観性があると考えます。しかし、今回のように論文掲載数の経年変化と抽出語リストや共起ネットワーク、クラスター分析などを比較した場合、比較段階でやはりどうしても主観的な見解が混じってしまうため、研究として何か決定打が足りないと感じました。
KH Coderには他にも様々なツールがあり、非常に便利だと感じます。しかし、私自身、研究の初心者であるため、十分に使いこなせていない現状です。そこで、今回の研究における考察の裏付けや追加研究が可能であると思われるKH Coder内のツールを教えて頂けると幸いです。
また、共起ネットワークに関しまして、中心性(媒介)を選択したときにFrequencyが小さいにも関わらず、Centralityが一番高い点が見つかりました。この場合の解釈は、如何なものとするべきか、御教授頂けないでしょうか。
長文になってしまいましたが、何卒よろしくお願いいたします。