[掲示板へもどる]
一括表示

  [No.1412] データのHTML化(タグ付け) 投稿者:油山  投稿日:2013/10/05(Sat) 12:20:04

樋口先生、

お世話になります、油山と申します。

ご教示いただきたいことがございます。
どうぞよろしくお願いいたします。


チュートリアルの以下の項目に関する質問です。

「KH Coderを使って分析するためにはデータをHTML化しなければならないのですか?」

(中略)

「こういった形のデータに対しては、正規表現をどう書けば良いのだろう?」といった場合、
KH Coder掲示板でご質問いただければ、わかる範囲でですが、お答えします。


−−−−−
ブログ分析を進めております。

ツールで取得したテキスト本文の形式は、"で囲まれており、
テキストエディタで表示すると、以下のようになります。

"・・・・・・
・・・・・
・・・・・・

・・・・・・・
・・・・・・・・・・・・・・・・・・"

これが1レコードになります。
延々と続きます。


KHcoderにインポートすると、改行単位で段落になってしまうことから、
レコード件数と一致させるために、データのHTML化(タグ付け)を検討しています。


出来上がりイメージは、以下のようになります。

<H1>ブログ本文</H1>
・・・・・・
・・・・・
・・・・・・

・・・・・・・
・・・・・・・・・・・・・・・・・・


これが1レコードになります。


チュートリアルにならい、正規表現を適用したいと思いますが、
誠に恥ずかしいのですが、この知識がございません。


ご教示いただければ、大変に助かります。
どうぞ、よろしくお願いいたします。


  [No.1413] Re: データのHTML化(タグ付け) 投稿者:HIGUCHI Koichi  投稿日:2013/10/05(Sat) 13:54:03

こんにちは、樋口です。書き込みありがとうございます。

以下の2回に分けて置換していただくのが簡便かと思います。秀丸の場合でし
たら、メニューから「検索」「置換」と進めて、「正規表現」にチェックを入
れて以下の置換を行います。

(1) 行頭に「"」があった場合「<h1>ブログ本文</h1>(改行)」に置換します。
検索:^"
置換:<h1>ブログ本文</h1>\n

(2) 行末の「"」を削除します。
検索:"$
置換:(空白)

※「(空白)」というのは、何も入力しないということです。


  [No.1415] Re: データのHTML化(タグ付け) 投稿者:油山  投稿日:2013/10/05(Sat) 17:23:15

樋口先生、

お世話になります、油山と申します。

ご教示いただき、誠にありがとうございました。

今までプレインテキストのみでしたが、
データをHTML化(タグ付け)する恩恵も体験することができました。

ありがとうございました。