[掲示板へもどる]
一括表示

  [No.2362] 動詞Bに分類される語の抽出について 投稿者:TOMITA  投稿日:2016/01/16(Sat) 12:03:24

樋口さん
こんにちは。

私は大学の研究で,中学校で用いられている複数の教科書の分析を行っ
ています。

「抽出語リスト」→「品詞別」で動詞Bに分類される単語のうち,特定の
単語を分析結果に反映させたいと思っています。
特定の単語といっても,名詞や動詞に分類されるような他の単語と同様
な1単語としての扱いであってほしいのです。

頻出150語,多次元尺度構成法を使わせていただいているのですが,動詞
Bを分析に含めてしまうと,一般的な単語が中心となった結果がでてしま
うため,動詞Bのチェックは外すしたいのです。
しかし,そうすると動詞Bに含まれる,その教科書の特徴を表すような単
語が分析結果に反映されないのは認識しております。

コーディングに該当するものかと思い,樋口さんのご著書やこちらの掲
示板等で調べたのですが,私のしたいことはコーディングの目的には当
てはまらないと判断できました。
活用語も含め1単語として抽出したいので,強制抽出も当てはまらないと
判断しました。

動詞Bに分類される特定の単語を,動詞Bのチェックを外した状態でも,
活用語も含めた1つの単語として抽出する方法は存在するのでしょうか?

お忙しい中大変申し訳ないのですが,ご回答よろしくお願いいたします


  [No.2364] Re: 動詞Bに分類される語の抽出について 投稿者:HIGUCHI Koichi  投稿日:2016/01/16(Sat) 16:11:48

こんにちは、樋口です。書き込みありがとうございます。

お書きいただいた問題は設計上、難しいところでして、お手間をおかけして恐
縮です。

現状のKH Coderですと、(1)動詞Bにチェックを入れた上で、(2)不要な語はすべ
て「使用しない語」(強制抽出の左隣)として指定していただくことになりま
す。

頻出150語については、動詞Bを除く設定で固定されているので、「1列」の表を
ご自身で加工していただくことになります。まずExcelのフィルタ機能で、品詞
を選び、それから3列に分けるというような形です。


別解として、(1)動詞Bにはチェックを入れないままで、(2)一部の語については
「動詞B」から「動詞」に品詞名を変更することも可能です。

メニューから「ツール」「SQL文の実行」を選択肢、以下のSQL文を実行します。
実行は一瞬で終り、何も結果は表示されませんが、「しまう」「ある」「いる」
については品詞名が「動詞」に変わります。

----------------------------------------------------------------------
update genkei
set khhinshi_id = 13
where
  khhinshi_id = 17
  and (
       name = 'しまう'
    or name = 'ある'
    or name = 'いる'
  )
----------------------------------------------------------------------

品詞名は前処理のたびにリセットされるので、前処理の度にこのSQL文を実行
する必要があります。「いる」の下に同じような行を追加すれば、3語だけでな
く、多くの語の品詞名を変更できます。

ここで指定している17、13などの品詞番号については、マニュアルの表A.2を
ご覧ください。