Re: データのHTML化(タグ付け) (油山) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1412] データのHTML化(タグ付け) 投稿者:油山  投稿日:2013/10/05(Sat) 12:20:04

樋口先生、

お世話になります、油山と申します。

ご教示いただきたいことがございます。
どうぞよろしくお願いいたします。


チュートリアルの以下の項目に関する質問です。

「KH Coderを使って分析するためにはデータをHTML化しなければならないのですか?」

(中略)

「こういった形のデータに対しては、正規表現をどう書けば良いのだろう?」といった場合、
KH Coder掲示板でご質問いただければ、わかる範囲でですが、お答えします。


−−−−−
ブログ分析を進めております。

ツールで取得したテキスト本文の形式は、"で囲まれており、
テキストエディタで表示すると、以下のようになります。

"・・・・・・
・・・・・
・・・・・・

・・・・・・・
・・・・・・・・・・・・・・・・・・"

これが1レコードになります。
延々と続きます。


KHcoderにインポートすると、改行単位で段落になってしまうことから、
レコード件数と一致させるために、データのHTML化(タグ付け)を検討しています。


出来上がりイメージは、以下のようになります。

<H1>ブログ本文</H1>
・・・・・・
・・・・・
・・・・・・

・・・・・・・
・・・・・・・・・・・・・・・・・・


これが1レコードになります。


チュートリアルにならい、正規表現を適用したいと思いますが、
誠に恥ずかしいのですが、この知識がございません。


ご教示いただければ、大変に助かります。
どうぞ、よろしくお願いいたします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)