いつもお世話になり、ありがとうございます。Kh coderでフランス語のテキストを分析しようとしているのですが、一部英語で記されている部分があり、そのまま含めてよいのか、それともデータから外した方がよいのか、迷っています。具体的には、行おうとしている分析は批評文の内容分析で、品詞を抽出して評価傾向をみる、という分析をしたいと考えています。全81件の批評文のうち、1件のみ英訳版しかないものがあるのですが、この内容がかなり重要なのでどうしょうかと迷っています。何卒よろしくお願いいたします。
こんにちは、樋口です。書き込みありがとうございます。KH Coderでは、語の基本形や品詞を比較的正確に認識できるのは、1つの分析対象ファイルに1言語のテキストが保存されている場合です。英語が混じっているという場合、英語部分の基本形や品詞認識が少しおかしくなることが予想されます。実際にお試しいただいて、このおかしくなり具合が許容範囲かどうか見ていただくのが良いかもしれません。「語の抽出結果を確認」コマンドで、原文からどのように語が取り出されたかをご覧いただけます。http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=3268&mode=allreadあるいは、英語部分をフランス語に翻訳して分析するかでしょうか。Googleなんかが大部賢くなってきましたので、計量分析という用途なら、自動翻訳でもある程度まではいけるかもしれません。