こんにちは、樋口です。書き込みありがとうございます。
メッセージ表示の流れ、再検討してみます。丁寧に状況をお教えいただき、大
変ありがとうございます。
また、同じデータ(こころ)同じ手法(ナイーブベイズ)であれば、同等程度
の性能が出ているようですね。TrueTellerでの検証結果を詳細にお教えいただ
き、感謝申し上げます。商用ソフトウェアもいくつかは買って様子を見ている
のですが、TrueTellerは手元にありませんでしたので、とても参考になりまし
た。重ねてお礼申し上げます。
なお、釈迦に説法かと思いますが、「こころ」の上・中・下を分けるのは、
ナイーブベイズ向けの課題といいますか、ナイーブベイズで上手くいきやすい
データ特性があると思います。上・中・下に特徴的な語が割とはっきりしてい
るからです。こういう各グループの特徴語がはっきりしているデータだとナイ
ーブベイズで上手くいきますが、そうでもない場合はComplementの方や、SVM、
Random Forestの方が精度が上がる可能性がありますのでご留意下さい。
(現状のKH Coderでは、学習結果を人間が目で見て理解できることを重視して
ナイーブベイズのみの採用となっていますが…)
なにはともあれ、例によって丁寧で示唆に富む書き込みに感謝申し上げます。