こんにちは、樋口です。書き込みありがとうございます。(3)と(4)では文書の長さをあらわす行列を「doc_length_mtr」に格納しています。length_cの列は文字数、length_wの列は語数です。今のところ、この情報を使っているのは、対応分析の「差異が顕著な語を分析に使用」オプションのみです。したがって、多次元尺度構成法、階層的クラスター分析、共起ネットワークなどでは不要な情報ということになります。p.s.いつも有益なご示唆をいただき、こちらこそありがとうございます。