Re: Excel データに対する「文書×抽出語」表出力 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.948] Re: Excel データに対する「文書×抽出語」表出力 投稿者:HIGUCHI Koichi  投稿日:2012/05/04(Fri) 20:34:56

こんにちは、樋口です。書き込みありがとうございます。

データを読み込んだ時点で、ケース数が減っているようですね。

まず、KH Coderは「分析対象ファイル」内の空行は「存在しないもの」とみな
しますので、空行があるとケース数が減ります。

また、Excel由来のデータでしたら、Excelのclean関数およびjis関数を通すこ
とで、制御文字の削除と、全角文字への変換を行うと、改善するかもしれませ
ん。

また、KH Coder上で「分析対象ファイルのチェック」を行い、問題がないかど
うか確認してみるのも良いでしょう。

※「分析対象ファイル」を修正した場合は、その結果を反映させるために、再
度「前処理の実行」を行って下さい。


以上を試しても上手くいかない場合は、「ツール」「テキストファイルの変形」
「HTMLからCSVに変換」とたどり、「段落」を選択してください。そして、出力
されたファイルと、入力ファイルを見比べ、どんな行(段落)が無くなってい
るのかを見てみて下さい。無くなっている行に、なんらかの共通性があれば、
それが原因でしょう。

ひとまず、以上をお試しいただけましたら幸いです。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)