樋口様
以前ジャストシステムのCBMIの説明会でお会いして、KH Corderの存在をご案内いただきました。
そのころは、単に関心があるので、勉強気分で参加しただけなのですが、最近になって、新聞記事の分析に着手しようと思っております。
そこで、KH Corderを含め、いくつかのテキストベースソフトウェアを調べて比較しようとしてみましたが、結局のところ、なにがどう違うのか、さっぱりわかりませんでした。
具体的に私の分野の先行研究で見かけたのは、
SPSS Clementine for text mining
野村総合研究所
KH Corder
の3種でした。
チュートリアルでご紹介いただいているWordMinerを用いた分析は、私が探した限りでは見つけることができませんでした。
ある記述によれば、テキスト分析は2種類に別れ、1つが、ClementineやTRUE TELLER(データマイニングの手法をテキストデータにも適用させるアプローチ)で、もう1つが、ジャストシステムのCBMIに代表される自然言語処理の研究をベースとして、テキスト分析や検索を発展させて、テキストから知識発見につなげるアプローチだと書いてあります。
ご存知の範囲で、それぞれのソフトの違いや、目的に応じた強み弱み等、お聞かせいただければ幸いです。
かなり料金が違うので、いったいなにが違うのか?ととても悩んでおります。
また、同じスレッドで聞くべきではありませんが、新聞記事を使ってKH Corderを使う場合、日付の1つ1つを見出しにして、<H1>年月 <H2>日付 などの形でマーキングすればよろしいのでしょうか?
こころ のチュートリアルは読んだのですが、ちょっと違う気がして、悩んでしまっております。