「環境白書をテキストマイニング分析する」という旨の卒業研究にてKHCoderを活用させていただいている者です。環境白書の本文をすべてメモ帳にコピーし、各年度ごとにH1タグで見出しを付けた状態のテキストファイルを使用しています。必要であれば、使用しているテキストファイル、コーディングルール等もメールでお送りいたします。誠に申し訳ないのですが、12月初旬に卒論提出のため可能な限り早期に解決していただけると嬉しいです。■お使いのKH Coderのバージョン3.Alpha.13m■KH Coderのインストール先フォルダ(解凍先フォルダ)C:/khcoder3■どんなエラー・不具合・問題ですか?コーディングルールの中で「温室効果ガス」のコードだけが頻度0と認識され、対応分析の際にエラーメッセージが出て分析できません。環境白書の本文中から茶筅で抽出した語でコーディングルールを作成しているので、頻度0ということはありえないはずなのですが…。単純集計でもやはり頻度は0、「温室効果ガス」以外のコードを使用する(チェックを外す)と対応分析ができます。■どのように操作すればその問題を再現できますか?*温室効果ガス温室効果ガス↑のような書式が含まれるコーディングルールを使って対応分析を行う■エラー・メッセージスクリーンショットを添付しました■コンソール・ウィンドウの表示内容スクリーンショットを添付しました■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか?いいえ■お使いのOSWindows 10
こんにちは、樋口です。書き込みありがとうございます。「温室効果ガス」という語が抽出されているのかどうか、「抽出語リスト」コマンドで検索してみるといかがでしょう。コーディングルールで指定できるのは、語として抽出されたものだけです。語として抽出されていないものについては'温室効果ガス'のようにシングルクォートで括る必要があります。
樋口先生、返信ありがとうございます。抽出語リストで調べたところ、語として抽出されていませんでした。強制抽出のときに「温室効果ガス」のみ漏れていたようです。問題が解決して本当に助かりました。ありがとうございました!