いつも大変お世話になっております。
今回ある学校の授業内容の文字解析を行うのにKH Coderを利用させてもらっています。
今回、形態素解析の茶筅が抽出した全ての抽出語の異なり語数(私のケースですと約4000語です)のJaccard係数をそれぞれ表にして示そうと思っています。(縦横4000✖️4000の表です)
ここで、関連語検索で一つ一つ単語を調べて表を作っていくにも語数が多すぎるので何か別の方法がないものかと模索しております。
大変ご多忙かとは思いますが,ご教授いただけたら幸いです。
では、よろしくお願いします。