樋口先生はじめまして、関と申します。KH Coderについて伺いたいですが、「ツール」の「共起ネットワーク」の下で、「共起の程度と線(edge)の太さ」にチェックを入れると、線の太さはどのような基準で決まりますか?閾値などはありますか?また、共起度を計算する際に、定義式はなんですか?テキストマイニングの初心者で、簡単な質問ですが、どうぞよろしくお願いします。
こんにちは、樋口です。書き込みありがとうございます。線の太さですが、特に閾値などは設定せずに、連続的な値で線の太さを指定しています。また共起の程度はJaccard係数で測定しており、この値を使って線の太さも指定しています。マニュアルの共起ネットワークのところも併せてご覧下さい。現在の版では、A.5.11節、54〜57ページです。
樋口先生お忙しい中、ご教示いただきありがとうございました。Rのコードを拝見いたしました。Jaccard係数を正規化しましたね。どうもありがとうございました。> こんにちは、樋口です。書き込みありがとうございます。> > 線の太さですが、特に閾値などは設定せずに、連続的な値で線の太> さを指定しています。> > また共起の程度はJaccard係数で測定しており、この値を使って線> の太さも指定しています。> > マニュアルの共起ネットワークのところも併せてご覧下さい。現在> の版では、A.5.11節、54〜57ページです。
計量テキスト分析初心者の中川と申します。KH Coderおよびそのマニュアルのおかげで何とか取り掛かれそうで、感謝しております。さて、共起ネットワークの線の太さですが、語Aと語Bのペアについて見た場合、一方が出現している段落(集計単位が段落)あるいは文(集計単位が文)の数に対し、もう一方も共に出現している数がどれだけあるかが重要で、ひとつの段落あるいは文の中に両者がそれぞれいくつ出現しているかは問わない、という理解でよろしいでしょうか?初歩的な質問で恐縮ですが、御教示いただければ幸いです。
こんにちは、樋口です。書き込みありがとうございます。はい、お書きいただいた通りです。Jaccard係数は出現あり(1)か出現なし(0)かだけを区別しており、出現数の大小は計算結果に影響しません。
お忙しい中、早々の御教示ありがとうございました。