[掲示板へもどる]
一括表示

  [No.385] アドインの頻出語リストについて 投稿者:永井英人  投稿日:2008/12/19(Fri) 15:06:41

分析ツールとして利用させていただいております。
本日、気がついた点でご質問いたします。
アドイン機能の「抽出語リスト品詞別 出現回数」機能を使用として
エラーが出る場合があるようです。
(おそらく単語が150に満たない場合ではないかと思われます。)

この点に関し、マクロのスクリプト修正箇所のご指示、
あるいは修正xlaファイルをご展開いただけると非常に助かります。

よろしくお願いいたします。


  [No.386] Re: アドインの頻出語リストについて 投稿者:HIGUCHI Koichi  投稿日:2008/12/19(Fri) 21:56:28

こんにちは、樋口です。書き込みありがとうございます。

これなんですが、実は、どういう条件のときにエラーが出るのか良く
分からなくて困っています。またExcelマクロ(VB Script?)の書き
方を私がよく分かっていないという問題もあります。

こんな小さなファイルでも、できあがる表はちょっともうひとつな
のですが、エラー表示は出ません。
http://khcoder.info/psnl/misc/test-0.csv

まず考えられるのは、
> MsgBox "ここまではOK: 1"
というような行をtable_wordfreq_150()関数のところどころに入れる
ことで、どこでエラーが出ていたのかを特定し、対処していただくと
いう方法でしょうか。

あるいは、エラーが発生するCSVファイルをお送りいただくというの
も、事情が許せば有効かと思われます。今回の場合はあまり可能性が
高くないのですが、エラーメッセージの内容を教えていただけると、
役立つかもしれません。

よろしくお願いいたします。


  [No.387] Re: アドインの頻出語リストについて 投稿者:永井英人  投稿日:2008/12/24(Wed) 15:59:45

ご回答いただき、ありがとうございます。
仰るとおり、短文でもエラーが出る場合と出ない場合があることが分かります。

この件に関し、少し私も試してみましたところ、以下の症状が確認できました。
環境はXP、エクセル2003です。

1.頻出150の対象に含まれていない品詞しか文中にない場合、エラーが表示される。
2.頻出150の対象の品詞が存在する場合、ツール本体の機能「抽出語リスト(品詞別・出現回数順)」で
抽出されたCSVファイルのA列に表示される語(通常は名詞になるかと思います)が、
1種類しかない場合、エラーが表示される。


また、同様にアドイン抽出語リストの「一列に整形」を使用する場合でも、
3.ツール本体の機能「抽出語リスト(品詞別・出現回数順)」で
抽出されたCSVファイルのA列に表示される語が、1種類しかない場合、エラーが表示される。


エラー表示は次になります。

実行時エラー'1004':


私の勘違いもあるかと思います。その場合は申し訳ありません。



また同機能について、今後改訂を検討されるご予定がございましたら、
別件でご検討いただきたい点がございます。
(お願いごとばかりで申し訳ございません)
現在は抽出語と出現数が表示されますが、加えて並びに文書数が表示されるとさらに便利であると、
個人的には感じています。

機会がございましたら、ご検討いただければ幸いです。
よろしくお願いいたします。


  [No.388] Re: アドインの頻出語リストについて 投稿者:HIGUCHI Koichi  投稿日:2008/12/26(Fri) 00:23:01

エラーが発生する条件を特定していただきまして、まことにありがとう
ございました。お教えいただきました条件で試してみましたところ、こ
ちらの環境でもエラーを再現することができました。

再現ができましたのでバグ修正を行いました。修正版をこちらに置いて
おきますので、適宜お試しいただけましたら幸いです。
http://khcoder.info/psnl/misc/khc.xla
(次のバージョンのKH Coderをリリースするまでの一時しのぎとして、
このファイルを置いておきます)

ご要望いただきました点につきましては、今後の検討課題とさせていた
だきます。なお当座の解決策(?)といたしましては、「ツール」「SQL文
の実行」で、以下のSQLを実行していただくという方法があります。

#---------------------------------------------------------------
SELECT
  genkei.name   as W,
  khhinshi.name as H,
  f             as DF,
  genkei.num    as TF
FROM khhinshi, genkei
  LEFT JOIN df_dan ON genkei_id = genkei.id
WHERE
      genkei.khhinshi_id = khhinshi.id
  and khhinshi.name != "否定助動詞"
  and khhinshi.name != "未知語"
  and khhinshi.name != "否定"
  and khhinshi.name != "名詞B"
  and khhinshi.name != "形容詞B"
  and khhinshi.name != "動詞B"
  and khhinshi.name != "副詞B"
  and khhinshi.name != "感動詞"
  and khhinshi.name != "その他"
ORDER BY DF DESC
LIMIT 150
#---------------------------------------------------------------

DFが文書数、TFが出現数を表します。文書数が多い順に150語表示します。
出現数が多い順に取り出す場合は、「ORDER BY DF DESC」となってい
るところを「ORDER BY TF DESC」に変更します。

また上のSQLでは、それぞれの段落を「文書」と見なしています。これを
段落ではなく文に変更するには、上のSLQで「df_dan」となっているとこ
ろを、「df_bun」に変更して下さい。また、H1見出しで括った部分を「
文書」と見なしたい場合は「df_h1」のようにします。

以上、ご参考にしていただけましたら幸いです。

デバッグにご協力いただきましたこと、重ね重ね御礼申し上げます。


  [No.389] Re: アドインの頻出語リストについて 投稿者:永井英人  投稿日:2008/12/29(Mon) 13:16:31

アドインの件、早急にご対応いただきまして、ありがとうございます。

また文書数の件につきましても、丁寧に方法を教えていただきまして、
ありがとうございました。
現在、行っている分析で文書数を数える必要が出て参り、困っておりましたので、大変助かりました。

深く感謝いたします。