樋口先生さま
お世話になります、袋井と申します。
KH coderの中でSOMが利用できることは大きい価値があります。
ご紹介された上品なマップに感動しました。
とてもとても楽しみしております。
SOM_PAkは私も使用経験があります。
ソースコードを眺めて勉強したこともございます。
RのSOM関連パッケージの使用経験もあります。
※私は色々なSOMソフトの使用経験がございますが、
今は、計算はバッチ型SOMツールを使用し、可視化は自作です。
U-Matrixは3次元表示しています。
2次元表示と比較すると、山がそびえるようなクラスタ境界は説得力があります。
クラスタリングについては、先生がご提案された、
クラスタ境界を参考にして、コードブックベクトルをWard法でクラスタリングする方法は、最良だと思います。
> 70語 x 110文書で6分、70語 x 1200文書だと90分程度。
学習時間に時間が掛かるということですが、
マップサイズに応じて、ステップを細かく設定して、丁寧な学習をされているからではないでしょうか?
計算時間を短縮する方法として、
学習回数を少なくするという方法もあるかもしれません。
大抵の本では、簡単なデータで大雑把な計算例しか掲載していませんので、
学習回数としてどの程度が適切か、情報が不足していると思います。
一般的に、ニューラルネットの学習は1000回行えば収束すると言われていますので、
学習時間に時間がかかるようであれば、この程度の回数で打ち切りという方法もあるのではないかと思います。
とてもとても楽しみにしております。