樋口先生
階層的クラスター分析を用いて文章データを複数のクラスターにまとめようと
試みているのですが、クラスター数の決定の判断に迷っております。
私の勉強した限りでは、併合水準と結果の解釈の容易さから、
総合的に判断する、ということでしたが、併合水準の解釈に悩んでおります。
クラスターを併合していく中で、値が大きく変化する箇所に着目する、
ということは理解できたのですが、”大きな変化”の前(併合水準が高い)を
採用すべきなのか、後(併合水準が低くなる)を採用すべきなのかという点が
わかりません。
どちらを目安とすべきなのでしょうか。
初学者のため、理解が至っていない点が多々あるかと思います。
ご教授頂けますと、幸いです。