Re: KWICの活用 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.2581] Re: KWICの活用 投稿者:HIGUCHI Koichi  投稿日:2016/09/10(Sat) 17:31:46
Re: KWICの活用 (画像サイズ: 1042×1103 111kB)

こんにちは、樋口です。書き込みありがとうございます。

いえ、現在の所、コーディングルーでは「任意の動詞」という指定はできませ
ん。コーディングルールでは、例えば「考える」「知る」のように動詞を特定
する必要があります。


「ている。」の前に頻出している動詞を調べるというような検索でしたら、
KWICが便利かなと思います。KWICの画面では、「抽出語」欄を開けたまま、品
詞欄に「動詞」と入力しての検索が可能です。つまり、「任意の動詞」といっ
た検索を行えます。

添付のスクリーンショットの例では、[i]「て」の直後(右1)に「いる」があ
り、[ii]直前(左1)に動詞があることという追加条件を指定しています。そ
して、直前(左1)に多く出てきた順に、語をソートしています。このデータ
(漱石「こころ」)では、「考えている」「知っている」「座っている」の順
に多かったようです。


※文末表現を見るなら、本当は[iii]2つ後(右2)に「。」があるという追加
条件も必要ですが、「こころ」ではこの指定を加えると、ほとんど数がありま
せんでした。よって、例示のために、この条件は加えずにスクリーンショット
をとりました。また、本当はスクリーンショットの「追加条件1」のところで
「活用形」欄に「基本形」と入力しないと、「ている」だけでなく「ていた」
もヒットします。

なお、事前の準備としてメニューから「前処理」「語の取捨選択」とたどり、
「品詞による語の選択」のところで、「その他」にチェックを入れておく必要
があります。そうしないと、機能語を検索することはできません。

それから、例えば「たのだ。」が「た」「の」「だ」と分割されているように、
文末表現が2つや3つ以上の語に分割されていると、上述のような検索ができな
くなるかもしれません。KWICの追加条件は今のところ3つまでしか指定できな
いためです。こうした場合は「たのだ」を強制抽出して、1語として扱うよう
にするのが一案かもしれません。そうすれば「たのだ」の右1に「。」があり、
左1に動詞があること、といった検索ができるようになります。


英語データの例ですが、こちらもご参考にしていだけるかもしれません。
http://www.slideshare.net/khcoder/20150307-engweb/21


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)