こんにちは、樋口です。書き込みありがとうございます。
> 文書の長さは、length_wの数値のことって間違いない
はい、これは間違いありません。
TF-IDFについては、ご自身では、1.と2.のどちらが正しいと考えますか? そ
して、それはなぜでしょう?
また、その正しい方と、「別の方法」とはどこが違っているでしょう?
あと、データが3行なのは、A〜Cクラスまでの3クラスが、それぞれの行に対応
して、3行になっていると言うことでしょうか?
> Aクラスのみ抽出語→共起ネットワーク分析
この「Aクラスのみ抽出語」というのは、どういうものでしょうか?
関連語検索で、Aクラスの学生に特徴的な語を検索した結果ということでしょ
うか。そして、関連語検索画面で「共起ネット」ボタンをクリックして、共起
ネットワークを作成したということでしょうか??
だとすれば、関連語検索でリストアップされる語=共起ネットワーク描画に使
用される語=Aクラスに特徴的な語、という理解で間違いありません。