Re: <H>区切りタグ内の単語のカウントについて (水野) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.604] Re: <H>区切りタグ内の単語のカウントについて 投稿者:   投稿日:2010/02/27(Sat) 10:33:47

水野です。
樋口様、いつもご丁寧なご教示ありがとうございます。
テキストマイニングを始めたばかりの小職にとって
本当に助かります。

「視認性の観点」というのは前者の意味でして、テキストデータを
エディタ等を使って、マニュアルで直接修復するような場合に必要な
視認性のことです。

数千件くらいのブログ記事データを使ってテキストマイニング
できないものかと、試しているものですから。

ブログ記事をテキストデータとして使う場合は、
本ツールに掛ける以前の、データクレンジング
(ぐちゃぐちゃな記述がある記事などを除去する
など)が大変です。

これからも、ご教示よろしくお願いいたします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)