再び失礼します。
テキストマイニングに使うテキストについてなのですが、膨大な文章のため
コピー&ペーストで元のテキストを用意しました。
そこで、KWICコンコーダンスを使うとき、文書が改行部分で区切られて
認識していることに気づきました。(文書表示で文章がぶつ切りだったため・・・)
最初は句読点で文書が区切られていると思っていたので
変な所で文章が区切られていることで抽出語や共起ネットワークの結果
に影響が出ていないか不安になりました。
これはこのままでも大丈夫なのでしょうか?
改善方法があれば教えてください。