[掲示板へもどる]
一括表示

  [No.3692] 前処理後にデータとして読込まれない行があります。 投稿者:KH Kim  投稿日:2018/06/13(Wed) 10:47:05
前処理後にデータとして読込まれない行があります。 (画像サイズ: 304×359 52kB)

KH Coderのエラーや不具合についてお知らせいただく際は、以下のテンプレートにご記入ください。エラーや不具合以外のコメントをお書きいただく際は、本テンプレートを削除してからご記入ください。

■お使いのKH Coderのバージョン
→3.Alpha.13g英語バージョン

■KH Coderのインストール先フォルダ(解凍先フォルダ)
→C:\khcoder3。

■どんなエラー・不具合・問題ですか?
 合計1,000行のExcel Fileですが、前処理後にデータとして読込まれない行があります。

■どのように操作すればその問題を再現できますか?


■エラー・メッセージ


■コンソール・ウィンドウの表示内容
 添付しました。

■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか?
→記入例:いいえ

■お使いのOS
→記入例:Windows 10,


  [No.3694] Re: 前処理後にデータとして読込まれない行があります。 投稿者:HIGUCHI Koichi  投稿日:2018/06/13(Wed) 13:02:52

こんにちは、樋口です。書き込みありがとうございます。

添付していただいたメイン画面を見ると、ちゃんと1000 cases読み込まれている
ようです。読み込まれていないと思われた理由を、教えていただけますか?

もしかすると、抽出語リスト(Frequency List)に出てこない語があるといった
理由でしょうか? その場合は、「新規プロジェクト(New Project)」画面で、
「分析対象とする列(Target Column)」を正しく指定しているかどうか、ご確
認ください。テキストデータが入っているExcelの列を選択する必要があります。


  [No.3697] Re: 前処理後にデータとして読込まれない行があります。 投稿者:KH Kim  投稿日:2018/06/14(Thu) 02:04:12

Re: 前処理後にデータとして読込まれない行があります。 (画像サイズ: 1425×925 359kB)

早速のお返事有難うございます。

仰る通り、抽出語リスト(Frequency List)に出てこない語があります。

テストの為にExcel Fileから問題のあるコラムだけを取り出し
サンプルファイルとし、テストした結果も同様です。

環境はWindows10 64bitで英文バージョンのMS Officeです。

抽出語リストに HKE-MWO という単語だけが出た来ないです。

それから、前処理後の結果が大文字から小文字の変更されているのは
何かの理由があるのでしょうか?

では、宜しくお願いします。


  [No.3699] Re: 前処理後にデータとして読込まれない行があります。 投稿者:HIGUCHI Koichi  投稿日:2018/06/14(Thu) 02:35:16

こんにちは、樋口です。書き込みありがとうございます。

KH Coderは基本的には言葉を分析するように作ってあります。そして、言葉の
なかでも名詞や動詞に注目し、どんな文章の中にでも出てくる助詞・助動詞は
(デフォルトの設定では)無視します。

今回の場合、おそらく「HTE-MWO」は名詞(Noun)と判定されず、助詞・助動詞
あるいは記号と判定されて、分析対象外になったことが考えられます。

メニューから「前処理(PRe-Processing)」「語の取捨選択(Select Words to
Analyze)」と選択して、「その他(OTHER)」にチェックを入れて「OK」をク
リックしてください。
https://www.slideshare.net/khcoder/quick-start-tutorial-of-kh-coder-3/11

それから抽出語リストを出すといかがでしょう?


  [No.3700] Re: 前処理後にデータとして読込まれない行があります。 投稿者:KH Kim  投稿日:2018/06/14(Thu) 05:32:32

解決しました。有難うございます。