こんにちは、樋口です。書き込みありがとうございます。
いえ、現在の所、コーディングルーでは「任意の動詞」という指定はできませ ん。コーディングルールでは、例えば「考える」「知る」のように動詞を特定 する必要があります。
「ている。」の前に頻出している動詞を調べるというような検索でしたら、 KWICが便利かなと思います。KWICの画面では、「抽出語」欄を開けたまま、品 詞欄に「動詞」と入力しての検索が可能です。つまり、「任意の動詞」といっ た検索を行えます。
添付のスクリーンショットの例では、[i]「て」の直後(右1)に「いる」があ り、[ii]直前(左1)に動詞があることという追加条件を指定しています。そ して、直前(左1)に多く出てきた順に、語をソートしています。このデータ (漱石「こころ」)では、「考えている」「知っている」「座っている」の順 に多かったようです。
※文末表現を見るなら、本当は[iii]2つ後(右2)に「。」があるという追加 条件も必要ですが、「こころ」ではこの指定を加えると、ほとんど数がありま せんでした。よって、例示のために、この条件は加えずにスクリーンショット をとりました。また、本当はスクリーンショットの「追加条件1」のところで 「活用形」欄に「基本形」と入力しないと、「ている」だけでなく「ていた」 もヒットします。
なお、事前の準備としてメニューから「前処理」「語の取捨選択」とたどり、 「品詞による語の選択」のところで、「その他」にチェックを入れておく必要 があります。そうしないと、機能語を検索することはできません。
それから、例えば「たのだ。」が「た」「の」「だ」と分割されているように、 文末表現が2つや3つ以上の語に分割されていると、上述のような検索ができな くなるかもしれません。KWICの追加条件は今のところ3つまでしか指定できな いためです。こうした場合は「たのだ」を強制抽出して、1語として扱うよう にするのが一案かもしれません。そうすれば「たのだ」の右1に「。」があり、 左1に動詞があること、といった検索ができるようになります。
英語データの例ですが、こちらもご参考にしていだけるかもしれません。 http://www.slideshare.net/khcoder/20150307-engweb/21
|