樋口先生、
お世話になります、油山と申します。
ご教示いただきたいことがございます。
どうぞよろしくお願いいたします。
チュートリアルの以下の項目に関する質問です。
「KH Coderを使って分析するためにはデータをHTML化しなければならないのですか?」
(中略)
「こういった形のデータに対しては、正規表現をどう書けば良いのだろう?」といった場合、
KH Coder掲示板でご質問いただければ、わかる範囲でですが、お答えします。
−−−−−
ブログ分析を進めております。
ツールで取得したテキスト本文の形式は、"で囲まれており、
テキストエディタで表示すると、以下のようになります。
"・・・・・・
・・・・・
・・・・・・
・・・・・・・
・・・・・・・・・・・・・・・・・・"
これが1レコードになります。
延々と続きます。
KHcoderにインポートすると、改行単位で段落になってしまうことから、
レコード件数と一致させるために、データのHTML化(タグ付け)を検討しています。
出来上がりイメージは、以下のようになります。
<H1>ブログ本文</H1>
・・・・・・
・・・・・
・・・・・・
・・・・・・・
・・・・・・・・・・・・・・・・・・
これが1レコードになります。
チュートリアルにならい、正規表現を適用したいと思いますが、
誠に恥ずかしいのですが、この知識がございません。
ご教示いただければ、大変に助かります。
どうぞ、よろしくお願いいたします。