樋口先生 様;
お世話になります、袋井と申します。
先生の所感を聞かせていただき、ありがとうございました。
よい勉強になりました。
> ただ、複数のクリークに所属する語(ノード)をどう表示するかといったこと
> や、コミュニティ抽出(クラスタリング)の結果と併せて見られるようにとな
> ると、なかなか、すぐにはアイデアが浮かばなかったりします。
私は、クリークの専用ソフトが手元にあり愛用していますが、
「KH Coderでクリークを利用できることに大きな意義がある」と思っております。
> どうぞ気長に、あまり期待せずに、お待ち下さい(苦笑)。
樋口先生のアイディアに大きな期待をしています。
NMFは、集合知プログラミングなどでも紹介されておりますので、今では一般的になってきたと思います。
NMFの代表的な論文である
Learning the parts of objects by non-negative matrix factorization
を初めて読んだ時には、驚きましたね。
興味深い特性をもっています。
とりあえずNMFを実行するのは簡単です。
NMFで最適なクラスタ数を推定する手法も提案されています。
しかし、精度の良いドキュメントクラスタリングを行うためには、工夫が必要だと思います。
Document Clustering Based On Non-negative Matrix Factorization
を読んで、そう思いましたね。
私は色々なクラスタリング手法を利用していますが、
Affinity Propagation Clustering に興味があります。
2007年にサイエンス誌に掲載されて大きな反響をよんだアルゴリズムです。
グラフクラスタリングとも関係がありそうです。
最後は関係のない話となり失礼をしましたが、
KH Coderのバージョンアップに大きな期待を寄せている人が多くいることを知りました。
私もファンの一人として楽しみにしております。