[掲示板へもどる]
一括表示

  [No.2042] 関連語検索と外部変数のAND検索について 投稿者:hiko  投稿日:2015/05/08(Fri) 17:01:33

樋口様

はじめまして。KHCoder利用させていただいております。

関連語検索で狙った結果が取れず、
ご助言頂きたく連絡させていだきました。

分析対象には、外部変数で年月を'2010/09'のように持たせていて
関連語検索をする時に、コーディングルールで指定した抽出語と、
直接入力で外部変数の年月を指定してAND検索をしています。

これにより、抽出語に対する関連語が外部変数で指定した月ごとに取得できる想定でおります。

なのですが、
・外部変数での年月の指定無(抽出対象となる全期間を想定)
・外部変数を指定した各月の合計
で関連語として抽出される語によって、共起の合算値が合うものと合わないものがあります。

確認点等もし、なにかあればご助言いただければと思います。
よろしくお願いいたします。


  [No.2043] Re: 関連語検索と外部変数のAND検索について 投稿者:HIGUCHI Koichi  投稿日:2015/05/11(Mon) 21:34:01

こんにちは、樋口です。書き込みありがとうございます。

関連語検索コマンドでは、現在の所、「特徴的でない」語はリストアップしな
い方針になっています。ここで「特徴的でない」とは、全体での出現確率の方
が、条件付き確率(共起欄の確率)よりも大きいことを言います。詳細はマ
ニュアルや、こちらのスレッドをご覧ください。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=1928&mode=allread

リストアップされない場合があるので、共起の合算値が(思ったより)小さく
なることはあり得るかと思います。

それとは違う形で「合わない」場合は、まったく別の現象かもしれませんが、
ひとまずのご返信までに。


  [No.2046] Re: 関連語検索と外部変数のAND検索について 投稿者:hiko  投稿日:2015/05/12(Tue) 11:30:58

樋口様

ご連絡ありがとうございます。

教えて頂いたスレッドとても参考になりました。
#質問前に見つけておらず、すみませんでした。

ご指摘いただいたとおり、「特徴的ではない」と判断され
抽出されていないケースがあったことがよく分かりました。

どうもありがとうございました。