[掲示板へもどる]
一括表示

  [No.3570] 「を〜たい」動詞と「が〜たい」動詞の分類について 投稿者:L.F.  投稿日:2018/04/08(Sun) 14:53:05

樋口先生

 お世話になります。りーです。
 「を動詞」は「たい」形にするとき、「が動詞たい」にすべきだという日本語教育の項目について,以下の二つを解決してみたいと思っていますが、躓いたところです。ご教示いただければと思います。

(1)どのような「を」格動詞が「を〜たい」のままに使われやすいか、どのような動詞が「が〜たい」の形で多く使われるか、分類すること。
→ 今のところ、コーパスから「をVたい」と「がVたい」のそれぞれの高頻度V50語を抽出しましたが、次はどういう手法なら目標をかなえそうですか。
(2)同じ動詞がどの対象語と組み合わせるときに「を〜たい」の形にするか、どのような対象語のときに「が〜たい」に変わる場合が多いか。
→今のところ、「を〜たい」と「が〜たい」の二つの形をともに多くもっているV20語について、それぞれの「を」対象語と「が」対象語20語ずつをまとめたうえで、頻度情報をふまえた対応分析を試してみましたが、ばらつきが大きすぎて、また寄与率が低すぎて、極端でカバー率の低い結果しか出ませんでした。

もしかすると、最初テキストをコーパスから抽出する段階からやりかたを間違っているでしょうか。そうでなければ、賢いやりかたでもおありでしょうか。なかなかうまく行かず、恥ずかしいかぎりです。
 どうぞ、ご教示の程、宜しくお願い申し上げます。
 どうぞ、宜しくお願いいたします。


  [No.3571] KWICの活用法: 品詞名だけでの検索や、追加条件の使用 投稿者:HIGUCHI Koichi  投稿日:2018/04/08(Sun) 18:35:08

KWICの活用法: 品詞名だけでの検索や、追加条件の使用 (画像サイズ: 1606×1092 219kB)

こんにちは、樋口です。書き込みありがとうございます。

私なら「KWICコンコーダンス」と「コロケーション統計」の機能を使うだろう
と思います。

ただし事前の準備として、KH Coderの品詞設定を変更して、格助詞と助動詞を
分析対象に含めておきます。デフォルトの設定ではKH Coderは機能語を分析対
象外として扱うためです。設定変更のためには「config/hinshi_chasen」をテ
キストエディタで開き、以下の2行を一番下に追記して上書き保存します。そ
して変更を反映させるために、再度前処理を実行します。

----------------------------------------------------------------------
25,"格助詞","助詞-格助詞"
26,"助動詞","助動詞"
----------------------------------------------------------------------

次に「KWICコンコーダンス」画面を開き、「品詞」欄に「動詞」とだけ入力し
ます。次に「追加条件」をクリックして、直前(左1)に「を」があり、直後
(右1)に「たい」があることと、という条件を指定します。これで「を+動詞
+たい」という順になっている部分をリストアップできます。

あとは「集計」をクリックして「コロケーション統計」画面を開き、「を」の
前に多く出てきている言葉を見るために「左2」でソートするだけです。私の
手元の新聞記事データ(300万文程度)では、添付スクリーンショットのように
「力」「結果」「理解」などの目的語が多かったようです。

上記の「を」を「が」に変えて同じ操作をして、結果を比較してはいかがでし
ょう?


  [No.3574] Re: KWICの活用法: 品詞名だけでの検索や、追加条件の使用 投稿者:  投稿日:2018/04/11(Wed) 16:46:48

樋口先生
 ご指導、ありがとうございます。
 データをエクセルとテキストの2種類にして、両方をkh-coderで解析してみましたが、ヒット数は異なります。なぜでしょうか。
 


  [No.3575] Re: 検索結果の違いについて 投稿者:HIGUCHI Koichi  投稿日:2018/04/11(Wed) 17:08:58

こんにちは、樋口です。書き込みありがとうございます。

本掲示板の最初のページにて、次のようなお願いを申し上げております。

> KH Coderのエラーや不具合についてお知らせいただく際は、以下の情報を書
> き添えてください:
> [1] お使いのKH CoderとOSのバージョン。KH Coderのバージョンはメニュー
> の「ヘルプ」「KH Coderについて」で確認可。
> [2] どんな操作をすればエラーが出るのか。回答者が同じ操作を行なえるよ
> う具体的に。
> [3] チュートリアルの漱石「こころ」データで試してみると、エラーなしに
> 分析/処理を行えるのかどうか。
> [4] 省略や意訳をしていない一字一句そのままのエラーメッセ-ジ、または
> エラー画面のスクリ-ンショット。

「回答者が同じ操作を行なえるよう具体的に」どんな検索を行なうと、結果が
どのように異なるのか、お書きいただけますか?


  [No.3576] Re: 検索結果の違いについて 投稿者:  投稿日:2018/04/11(Wed) 18:23:39

樋口先生
 失礼しました。
返事という形で送るつもりでしたので、書かずに投稿しました。
「を動詞たい」と「が動詞たい」の対象語の比較を行うことが目的です。
前回お教えの通りに、動詞たいの用例(前文脈(格助詞で結ぶ)、キー(動詞)、後文脈(「たい」から始まる))を[秀丸]に書き込んだものと、それを[エクセル](同じ3列を含む)のまま、kh-coderで「コロケーション」の「集計」を実施したところ、ヒット数が違う結果が得られました。その原因として何が考えられますか?「エクセル」のほうはヒット数が低いが、信頼性が高いと考えてもよろしいでしょうか。


  [No.3577] Re: 検索結果の違いについて 投稿者:HIGUCHI Koichi  投稿日:2018/04/11(Wed) 19:32:04

こんにちは、樋口です。

Excelファイルの場合、KH Coderが分析対象と見なすのは1つの列だけです。
https://www.slideshare.net/khcoder/data-preparation-for-kh-coder

3列あるうちの2列が無視されたためにそのような結果になったのでしょう。

> 前回お教えの通りに、

私の先の書き込みには、結果をExcelや秀丸に書き出すなどという手順は
なかったはずです。


  [No.3578] Re: 検索結果の違いについて 投稿者:  投稿日:2018/04/11(Wed) 20:09:32

樋口先生
  
 承知いたしました。
 どこで認識が間違ったのか、わかったような気がします。
ありがとうございました。