[掲示板へもどる]
一括表示

  [No.3821] 特定のコードの頻度が0になってしまいます 投稿者:Daisuke  投稿日:2018/09/20(Thu) 07:53:30
特定のコードの頻度が0になってしまいます (画像サイズ: 1920×1080 685kB)

「環境白書をテキストマイニング分析する」という旨の卒業研究にてKHCoderを活用させていただいている者です。環境白書の本文をすべてメモ帳にコピーし、各年度ごとにH1タグで見出しを付けた状態のテキストファイルを使用しています。必要であれば、使用しているテキストファイル、コーディングルール等もメールでお送りいたします。誠に申し訳ないのですが、12月初旬に卒論提出のため可能な限り早期に解決していただけると嬉しいです。
■お使いのKH Coderのバージョン
3.Alpha.13m
■KH Coderのインストール先フォルダ(解凍先フォルダ)
C:/khcoder3
■どんなエラー・不具合・問題ですか?
コーディングルールの中で「温室効果ガス」のコードだけが頻度0と認識され、対応分析の際にエラーメッセージが出て分析できません。環境白書の本文中から茶筅で抽出した語でコーディングルールを作成しているので、頻度0ということはありえないはずなのですが…。単純集計でもやはり頻度は0、「温室効果ガス」以外のコードを使用する(チェックを外す)と対応分析ができます。

■どのように操作すればその問題を再現できますか?
*温室効果ガス
温室効果ガス
↑のような書式が含まれるコーディングルールを使って対応分析を行う

■エラー・メッセージ
スクリーンショットを添付しました
■コンソール・ウィンドウの表示内容
スクリーンショットを添付しました

■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか?
いいえ

■お使いのOS
Windows 10


  [No.3822] Re: コーディングルールでそのまま指定できるのは抽出語だけです 投稿者:HIGUCHI Koichi  投稿日:2018/09/20(Thu) 15:14:06

こんにちは、樋口です。書き込みありがとうございます。

「温室効果ガス」という語が抽出されているのかどうか、「抽出語リスト」コマンドで
検索してみるといかがでしょう。

コーディングルールで指定できるのは、語として抽出されたものだけです。語として抽出
されていないものについては'温室効果ガス'のようにシングルクォートで括る必要があり
ます。


  [No.3828] Re: コーディングルールでそのまま指定できるのは抽出語だけです 投稿者:Daisuke  投稿日:2018/09/26(Wed) 07:21:17

樋口先生、返信ありがとうございます。
抽出語リストで調べたところ、語として抽出されていませんでした。強制抽出のときに「温室効果ガス」のみ漏れていたようです。
問題が解決して本当に助かりました。ありがとうございました!