Re: ベイズ学習による分類−外部学習から学習 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1154] Re: ベイズ学習による分類−外部学習から学習 投稿者:HIGUCHI Koichi  投稿日:2012/10/18(Thu) 21:20:51

こんにちは、樋口です。書き込みありがとうございます。

> 「交差妥当化」にチェックを入れない場合、「学習結果を新規ファイルに保
> 存」を2回、聞いてきますが、振る舞いは、これでよろしいのでしょうか?

いや、良くないと思います。これも、こちらの環境では今のところ発生してい
ないので、もう少し調べてみます。

何かの操作をしたら、それ以降、この現象が発生したというような心あたりが
もしおありでしたらご教示ください。

> 「交差妥当化を行う」のチェックの有無による振る舞いの違い

デフォルトのfold 10による交差妥当化では、まずデータを10分割します。こ
の分割には乱数を使っています。そして、1つのグループを除いて、残り9グル
ープによる学習を行います。この学習結果を使って、除いてあった1つのグル
ープの自動分類を行います。これを10回繰り返すことで、結局、全グループの
自動分類を行います。そして、自動分類が正しかったかどうかを確認するのが
KH Coderにおける交差妥当化です。

KH Coderではこの交差妥当化の際に、試験的に行った分類の結果やログを保存
して、後から詳細を確認することができます。

それに対して交差妥当化を行わない場合は、学習処理のみで、自動分類は行わ
れません。そのため、分類結果やログを保存することはできません。

> チュートリアルのbayes_training.csvの27ケース(学習用)を学習用データ
> として、110ケースを検証用データとするという意味でしょうか?

はい、そのような形です。より正確には、bayes_training.csvの27ケース(学
習用)を学習用データとして、残りの110 - 27 = 83ケースを検証用データと
しています。

> 分類の「見本」もしくは教師信号

あいまいでしたね。「分類の『見本』、言葉を換えると教師信号」とご理解く
ださい。

> マニュアルのp72の、脚注について、ご確認させてください。
>
> 手元には実行できるデータがないので確認できませんが、
> 複数の事柄分だけ学習を行い、その学習結果を、同一の学習結果
> ファイルにAppendすればよいのですね。

はい、複数の事柄分だけ学習を行っていただくことになります。ただ、学習結
果ファイルも別々にしてください。そして、事柄分だけ(学習結果ファイルの
数だけ)分類を行っていただくという形になります。

> Complement Naive Bayes

これはなかなか良さそうですが、以前探した時にはPerl用ライブラリはありま
せんでした。せっかくTrueTellerと比べていただけるようでしたら、「Naive
Bayes」なら同じくらいの性能が出ているのかどうかから確認していただくと
良いかもしれません。(出ていなかったら少し困るのですが、まぁ、きっとそ
の場合は何かバグがあるのでしょうから…)


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)