[掲示板へもどる]
一括表示

  [No.2693] コーディングルールのカウント 投稿者:明石  投稿日:2016/10/30(Sun) 17:51:57

樋口先生、
お世話になります、明石と申します。

コーディングルールについて、ご質問がございます。
どうぞ、よろしくお願いします。


抽出語「多い」の否定語は、以下のコーディングルールで抽出できると理解しています。

*多い(否定)
seq(多い-ない)[b5]


抽出語"多い"が出現する文書集合を、A
コーディングルール"*多い(否定)" が出現する文書集合を、B
とした時に、

A−B の差集合を抽出するコーディングルールの検討をしていますが、分かりません。

ご教示をいただければ助かります。
よろしくお願いいたします。


  [No.2694] Re: コーディングルールのAND NOT条件 投稿者:HIGUCHI Koichi  投稿日:2016/10/30(Sun) 21:23:34

こんにちは、樋口です。書き込みありがとうございます。

こんな感じでいかがでしょう。

*多い(差分)
多い and not seq(多い-ない)[b5]


  [No.2695] 【御礼】 Re: コーディングルールのAND NOT条件 投稿者:明石  投稿日:2016/10/31(Mon) 09:02:29

樋口先生、

お世話になります、明石と申します。
ご教示をいただき、誠にありがとうございました。
御礼を申し上げます。

−−−
私なりに色々と考えてみました。

文書idも併せて出力すれば、
Rで、集合A、Bの差集合を計算することができますので、
集合A、Bを各々取得するコーディングルールを作成し、
テキスト分類で、集合A、Bを取得すればよいかと思いました。


もっとシンプルな方法があるだろうと思い、勇気を振り絞って、
投稿させていただきました。

ありがとうございます。よいハロウィンになりました。


ありがとうございました。
> こんにちは、樋口です。書き込みありがとうございます。
>
> こんな感じでいかがでしょう。
>
> *多い(差分)
> 多い and not seq(多い-ない)[b5]