Re: 低い出現回数の語から宝探しをするには。 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.501] Re: 低い出現回数の語から宝探しをするには。 投稿者:HIGUCHI Koichi  投稿日:2009/09/01(Tue) 21:25:50

こんにちは、樋口です。書き込みありがとうございます。

そのアドバイスを下さった方は、いかにして「かなり低い出現回数ながら媒介
的に重要だった」という発見をなさったのか、教えて下さいましたでしょうか。
私自身も興味深いところです。

ともあれ、計量的な分析においては頻度の高い語に注目するのが常道ですから、
低頻度語に注目するというのはなかなか難しいものがあります。強いて挙げる
ならば、以下のような方法が考えられなくもありません。

1. 品詞で絞る
共起ネットワークあるいはその他の多変量解析で、名詞だけ、動詞だけ、形容
詞だけといったように、特定の品詞に絞って分析を行えば、多少は低頻度の語
も分析に含められるでしょうか。

2. 「関連語探索」の活用
関連語探索で、ソート順として「確率比」を選びます。こうすると頻度が高か
ろうと低かろうと、とにかく「特徴的」な語からリストアップされます(出現
確率が何倍になったかという単純な計算になるからです)。したがって、頻度
の低い語もかなり出てくると思います。

3. コーディング
「数は少なくても、こういうものには特別な意味があるはず」という目星がつ
いていれば、そういうものをコーディングルールでひろうと良いでしょう。

4. もとのテキストデータの閲覧
計量テキスト分析では、計量的分析の結果が何を意味しているかということを、
常に、もとのテキストデータにあたって確認しつつ分析することをお勧めして
います。例えば、「ある時期の新聞記事には語Aが特徴的だった」ということ
が計量的分析から分かった場合、実際に語Aがどんなふうに使われていたのか
を「KWICコンコーダンス」や「文書検索」で確認するということです。そうし
た形でもとのテキストデータを閲覧するときには、特に、数の少ない語(低頻
度の語)に注意しながら読まれることをお勧めします。往々にして、質的な味
わいのようなものを引き出してくれるのは、そうした低頻度の語であることが
多い気がします。そういう意味でも、これはお勧めです。

今思いつくのは以上のような所でしょうか。どうぞよろしくお願いいたします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)