樋口先生
お疲れ様です
卒業論文執筆でKH Coderにいつもお世話になっている学生です
私はブログの文章をコーディングして
クラスターに分け
類似度行列を行ったのですが、
解釈の仕方が分からずに困っています
コーディングを
*死
死ぬ or 死
*恋
恋 or 愛する
にして、類似度行列をした際に出てくる数値は
*死 に登録した単語と
*恋 に登録した単語が
登場する文脈がどれ程似通っていたかを
表すという解釈でいいのでしょうか?
類似度行列の数値は何と何を比較して出されたものなのでしょうか?
初歩的な質問で申し訳ございません
お時間がございましたら、教えてください