Re: アドインの頻出語リストについて (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.388] Re: アドインの頻出語リストについて 投稿者:HIGUCHI Koichi  投稿日:2008/12/26(Fri) 00:23:01

エラーが発生する条件を特定していただきまして、まことにありがとう
ございました。お教えいただきました条件で試してみましたところ、こ
ちらの環境でもエラーを再現することができました。

再現ができましたのでバグ修正を行いました。修正版をこちらに置いて
おきますので、適宜お試しいただけましたら幸いです。
http://khcoder.info/psnl/misc/khc.xla
(次のバージョンのKH Coderをリリースするまでの一時しのぎとして、
このファイルを置いておきます)

ご要望いただきました点につきましては、今後の検討課題とさせていた
だきます。なお当座の解決策(?)といたしましては、「ツール」「SQL文
の実行」で、以下のSQLを実行していただくという方法があります。

#---------------------------------------------------------------
SELECT
  genkei.name   as W,
  khhinshi.name as H,
  f             as DF,
  genkei.num    as TF
FROM khhinshi, genkei
  LEFT JOIN df_dan ON genkei_id = genkei.id
WHERE
      genkei.khhinshi_id = khhinshi.id
  and khhinshi.name != "否定助動詞"
  and khhinshi.name != "未知語"
  and khhinshi.name != "否定"
  and khhinshi.name != "名詞B"
  and khhinshi.name != "形容詞B"
  and khhinshi.name != "動詞B"
  and khhinshi.name != "副詞B"
  and khhinshi.name != "感動詞"
  and khhinshi.name != "その他"
ORDER BY DF DESC
LIMIT 150
#---------------------------------------------------------------

DFが文書数、TFが出現数を表します。文書数が多い順に150語表示します。
出現数が多い順に取り出す場合は、「ORDER BY DF DESC」となってい
るところを「ORDER BY TF DESC」に変更します。

また上のSQLでは、それぞれの段落を「文書」と見なしています。これを
段落ではなく文に変更するには、上のSLQで「df_dan」となっているとこ
ろを、「df_bun」に変更して下さい。また、H1見出しで括った部分を「
文書」と見なしたい場合は「df_h1」のようにします。

以上、ご参考にしていただけましたら幸いです。

デバッグにご協力いただきましたこと、重ね重ね御礼申し上げます。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)