こんにちは、樋口です。書き込みありがとうございます。
私なら「KWICコンコーダンス」と「コロケーション統計」の機能を使うだろう と思います。
ただし事前の準備として、KH Coderの品詞設定を変更して、格助詞と助動詞を 分析対象に含めておきます。デフォルトの設定ではKH Coderは機能語を分析対 象外として扱うためです。設定変更のためには「config/hinshi_chasen」をテ キストエディタで開き、以下の2行を一番下に追記して上書き保存します。そ して変更を反映させるために、再度前処理を実行します。
---------------------------------------------------------------------- 25,"格助詞","助詞-格助詞" 26,"助動詞","助動詞" ----------------------------------------------------------------------
次に「KWICコンコーダンス」画面を開き、「品詞」欄に「動詞」とだけ入力し ます。次に「追加条件」をクリックして、直前(左1)に「を」があり、直後 (右1)に「たい」があることと、という条件を指定します。これで「を+動詞 +たい」という順になっている部分をリストアップできます。
あとは「集計」をクリックして「コロケーション統計」画面を開き、「を」の 前に多く出てきている言葉を見るために「左2」でソートするだけです。私の 手元の新聞記事データ(300万文程度)では、添付スクリーンショットのように 「力」「結果」「理解」などの目的語が多かったようです。
上記の「を」を「が」に変えて同じ操作をして、結果を比較してはいかがでし ょう?
|