Re: 「抽出語×文脈ベクトル」表について (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1710] Re: 「抽出語×文脈ベクトル」表について 投稿者:HIGUCHI Koichi  投稿日:2014/06/13(Fri) 10:06:17

こんにちは、樋口です。書き込みありがとうございます。

> 以下の2つの方法の使いわけの指針です。
>
> (1)自己組織化マップのコマンド
>
> 「文書−抽出語」表から、語の共起度を測るための標準化を行って、
> 「語−語」の表を作成し、これを、自己組織化マップの入力ベクトルとしている
>
> (2)KH Coderの本、4.2.2、5.3.1節
>
> 「抽出語×文脈ベクトル」表を、自己組織化マップの入力ベクトルとしている。

どちらも自己組織化マップによるクラスタリングですね(5.3.1節だけは違い
ますが)。

(1)では共起のパターンを直接的に用いてクラスタリングするということにな
ります。行っていることがシンプルで、分析者自身による解釈も、第三者への
説明もしやすいでしょう。また処理時間も短いです。

それに対して(2)では、共起を直接的に見ずに文脈を見ることで、元のテキス
トからより多くの情報を引き出してクラスタリングを行うという主旨になりま
す。

※ここで「文脈」というのは、上の投稿(No.1707)で書いた「一緒に使われ
ている語」のことです。

同じく上の投稿で書きました「共起ネットワーク」そのものは、あまり関係あ
りません。単に「共起ではない」ということを書きたかっただけでして、紛ら
わしくて失礼いたしました。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)