[掲示板へもどる]
一括表示

  [No.2580] 文末表現(機能語)の抽出方法について 投稿者:イワシタ  投稿日:2016/09/10(Sat) 16:35:10

樋口先生

初めて投稿させていただきます。イワシタと申します。
作文データの中から文末表現(例 ている、られる、である、のだ など)
を抽出し度数を数えた上で、
それらが、どのような内容語と結びついているかを分析したいと思っています。

以下の書き込みを参考に

>[No.1067] Re: コーディングルールの記述(文末表現のカウント)

条件記述によるコーディングで可能ではないかと考えたのですが、
動詞+ている、動詞+られるといった形での条件文の作成はできますでしょうか。

初めて使用しているので、的外れな点がありましたら申し訳ありません。
マニュアルおよび樋口(2014)、書き込みなど拝見したのですが、
適当な方法を探すことができず、ご質問しました。
お忙しいところ恐縮ですが、もし方法として、可能でしたら
記述方法の例をご教示いただけたら幸いです。
どうぞよろしくお願いします。

イワシタ


  [No.2581] Re: KWICの活用 投稿者:HIGUCHI Koichi  投稿日:2016/09/10(Sat) 17:31:46

Re: KWICの活用 (画像サイズ: 1042×1103 111kB)

こんにちは、樋口です。書き込みありがとうございます。

いえ、現在の所、コーディングルーでは「任意の動詞」という指定はできませ
ん。コーディングルールでは、例えば「考える」「知る」のように動詞を特定
する必要があります。


「ている。」の前に頻出している動詞を調べるというような検索でしたら、
KWICが便利かなと思います。KWICの画面では、「抽出語」欄を開けたまま、品
詞欄に「動詞」と入力しての検索が可能です。つまり、「任意の動詞」といっ
た検索を行えます。

添付のスクリーンショットの例では、[i]「て」の直後(右1)に「いる」があ
り、[ii]直前(左1)に動詞があることという追加条件を指定しています。そ
して、直前(左1)に多く出てきた順に、語をソートしています。このデータ
(漱石「こころ」)では、「考えている」「知っている」「座っている」の順
に多かったようです。


※文末表現を見るなら、本当は[iii]2つ後(右2)に「。」があるという追加
条件も必要ですが、「こころ」ではこの指定を加えると、ほとんど数がありま
せんでした。よって、例示のために、この条件は加えずにスクリーンショット
をとりました。また、本当はスクリーンショットの「追加条件1」のところで
「活用形」欄に「基本形」と入力しないと、「ている」だけでなく「ていた」
もヒットします。

なお、事前の準備としてメニューから「前処理」「語の取捨選択」とたどり、
「品詞による語の選択」のところで、「その他」にチェックを入れておく必要
があります。そうしないと、機能語を検索することはできません。

それから、例えば「たのだ。」が「た」「の」「だ」と分割されているように、
文末表現が2つや3つ以上の語に分割されていると、上述のような検索ができな
くなるかもしれません。KWICの追加条件は今のところ3つまでしか指定できな
いためです。こうした場合は「たのだ」を強制抽出して、1語として扱うよう
にするのが一案かもしれません。そうすれば「たのだ」の右1に「。」があり、
左1に動詞があること、といった検索ができるようになります。


英語データの例ですが、こちらもご参考にしていだけるかもしれません。
http://www.slideshare.net/khcoder/20150307-engweb/21


  [No.2595] Re: KWICの活用 投稿者:イワシタ  投稿日:2016/09/11(Sun) 19:47:22

樋口先生、こんばんは。
早速のご返事ありがとうございます。

スクリーンショットまで作成いただいての具体的なご説明、
前処理の方法、英語のURLまでご教示いただき、大変助かりました。

KWICの方法は試していたのですが、
具体的にご説明頂いた作業を行っていなかったため、
狙いの結果にたどり着けずにいました。

早速、作業を進めてみたいと思います。
ありがとうございました。

イワシタ