Re: 文書の改行の扱いについて (キリン) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.2064] 文書の改行の扱いについて 投稿者:キリン  投稿日:2015/05/19(Tue) 17:08:32

再び失礼します。

テキストマイニングに使うテキストについてなのですが、膨大な文章のため
コピー&ペーストで元のテキストを用意しました。

そこで、KWICコンコーダンスを使うとき、文書が改行部分で区切られて
認識していることに気づきました。(文書表示で文章がぶつ切りだったため・・・)

最初は句読点で文書が区切られていると思っていたので
変な所で文章が区切られていることで抽出語や共起ネットワークの結果
に影響が出ていないか不安になりました。

これはこのままでも大丈夫なのでしょうか?
改善方法があれば教えてください。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)