[掲示板へもどる]
一括表示

  [No.1093] 文脈ベクトルの数値の意味について 投稿者:酒井  投稿日:2012/09/15(Sat) 21:36:17

いつもお世話になっております。
基本的な質問で誠に恐縮ですが、ご教授ください。

抽出語×文脈ベクトルに関して
このような使い方で良いのか、また、文脈ベクトルの数値の意味について質問いたします。

共起ネットワークの語彙がどのような文脈で使用されているのか知りたいと思い、抽出語×文脈ベクトルを使用してみました。
しかしながら、文脈ベクトルで出てきた、いろいろな数値の意味が分かりません。
この数値(高い、低い)には、どのような意味があるのでしょうか?

理解が及ばず申し訳ございませんが、どうぞ宜しくお願い致します。


  [No.1094] Re: 文脈ベクトルの数値の意味について 投稿者:HIGUCHI Koichi  投稿日:2012/09/15(Sat) 21:51:06

こんにちは、樋口です。書き込みありがとうございます。

いえいえ、初歩的なご質問は大歓迎です。

> 共起ネットワークの語彙がどのような文脈で使用されているのか知りたい

この場合には、「KWICコンコーダンス」コマンドを使って検索していただくの
がもっともお勧めです。検索結果が多くて目で見るのが難しい場合、「KWICコ
ンコーダンス」画面の右下にある「集計」ボタンをクリックし、コロケーショ
ン統計を見るのも良いでしょう。検索した語の前後に、どんな語が多く出てき
ていたのかを見ることができます。

> 文脈ベクトル

これは目で見るためのものというより、クラスター分析・MDS・共起ネットワ
ーク・自己組織化マップなどに利用するためのものです。

マニュアルの図50を横に見ていきますと、「先生」が出現する文書には、平均
して「先生」が1.062回、「奥さん」が0.107回、「自分」が0.018回出現して
いたことが分かります。「奥さん」が出現する文書には、「先生」が0.160回、
「奥さん」が1.016回、「自分」が0.126回ですね。

この表を使えば、こうした「『先生』『奥さん』が他にどんな語と一緒に使わ
れていたのか」という情報をもとに、『先生』『奥さん』 etc.のクラスタリ
ング等を行うことができます。