樋口先生
お世話になっております。呉と申します。
中国語テキストの分析に関して、幾つわからないところがあります。 使っているバージョンは khcoder-3a10m-macdl です。 1)KH coderで中国語の形態素分析はどのようなルールですか。 2)中国語に対して、stop wordsは自分で設定しますか? 今手元のデータに分析を行いましたが、抽出語に"也"(also)、 "要"(want/will)がでてきました。この場合は 画像のステップで使用しない語の指定で設定で良いでしょうか。 3)抽出語に同じことを指す違う言葉が別の言葉としてリストされています。例えば、Top 10の抽出語に「北京」「北京市」「京」がでてきました。この三つの言葉を一つにまとめて抽出語リストに出したい場合はどうすれば良いでしょうか。 4)「社会調査のための計量テキスト分析」の本を読んでいます。中国語の分析もこの本に参考してよろしいでしょうか。
以上、ご返信にいただければ助かります。
どうぞ宜しくお願い致します。
呉
|