樋口先生さま
お世話になります、袋井と申します。
いつもありがとうございます。
勇気をふりしぼって、先生にご相談してよかったと感謝しています。
ある程度までは、定められた手順・手続きに沿って進めていくということが大切だと思っております。
チュートリアルpdfの2頁目に、2段階による接近について書かれています。
抽出語を受身的に使う第一段階から、能動的にコーディングルールを作成して取り出すという第二段階に
ステップアップする良い機会となりそうです。
追伸;
KH Coder on Twitterで情報提供していただきました、Random Forestによるクラス分類は、おもしろいですね。
Random Forestによる文書分類を試してみたいと思います。
KH coderの文書分類として、ナイーブベイズに加えて、Random Forestの要望も出てくるかもしれませんね。
関連資料を見ると、
Random Forestを適用すると、線形分離困難なirisデータでも、ここまできれいに分離できるのですね。
SVMでやったことはあり、カーネル学習に没入した時期もありましたが、Random Forestは食わず嫌いでした。
良い情報を教えていただき、ありがとうございました。
重ねて御礼を申し上げます。