khcoderとは直接的には関係のない、非常に基本的な質問かと思いますので、可能な範囲でご教授いただけましたら幸いです。
いろいろな文書を共起ネットワークで見ていると、以下のような場合が見られます。
1、元々の文書数は少ないのに、共起ネットワークでは多数の言葉と結びついている場合
2、元々の文書数は多いのに、共起ネットワークでは少数の言葉と結びついている場合
このような場合の共起ネットワークの意味について質問いたします。
つまり…
1、は文書数は少ないが、同じような言葉が同じようなパターンで使用されている場合が多い。
2、は文書は多いが、言葉はバラバラな状態であり、出現パターンが似ているものは少ない。
という理解で良いのでしょうか?
いまいち、共起ネットワークの意味が呑み込めず、理解について何か助言がいただけましたら幸いです。
どうぞ宜しくお願いいたします。