Re: 「ベイズ学習による分類」について (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.684] Re: 「ベイズ学習による分類」について 投稿者:HIGUCHI Koichi  投稿日:2010/11/19(Fri) 17:47:57

こんにちは、樋口です。書き込みありがとうございます。

お節介かなとも思うのですが、チュートリアルでは説明のために、ああした手
順をとっております。すなわち、(1)ランダムに選んだ文書だけ(「学習」
変数)を使って学習し、(2)それ以外の文書を自動分類し、(3)「正解」変
数と比べてチェックという、交差妥当化を手動で行う手順のことです。

実際の分析では、チュートリアルで言う「正解」変数を用いて、交差妥当化オ
プションを使われるのがお勧めです。(すでにそのようにされていたら申し訳
ありません)


なお、一般的にはケース数が増えれば結果は良くなることが多いのですが、必
ずしもそうならない場合もあります。分類ログファイルを見て、誤分類がなぜ
生じているのかを見ながら作業を進められると良かもしれません。ケース数が
増えれば改善しそうな誤りなのか、そうでないのかを見つつ、ということです。
(そう簡単に区別がつかない場合もありますが…)

また、あくまで一般的な傾向ですが、1つのカテゴリーに含まれる文書の数が
減ると、そのカテゴリーの特徴を学習することが難しくなってしまい、状況が
悪化してしまうことも起こりえますのでご注意下さい。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)