いつもお世話になっております。
例えば下記のようなテキストファイルの、
H1タグごとの抽出語の出現回数の出し方についてお伺いいたします。
[テキストファイル例ここから]++++++++++++++++++++++
<H1>文書1の見出し</H1>
<H2>2004</H2>
文書の内容・・・
<H2>2005</H2>
文書の内容・・・
<H1>文書2の見出し</H1>
<H2>2004</H2>
文書の内容・・・
<H2>2005</H2>
文書の内容・・・
<H1>文書3の見出し</H1>
<H2>2004</H2>
文書の内容・・・
<H2>2005</H2>
文書の内容・・・
[テキストファイル例ここまで]++++++++++++++++++++++
ツール>抽出語リストでは、テキストファイル全体の抽出語の出現回数しか
出せないと思いますが、H1タグごとの抽出語の出現回数を出す方法は、
ありますでしょうか。
例えば下記のリストを作成したいのですが、この場合は、
別個のテキストファイルに分けて作業したほうがよろしいのでしょうか。
文書1の抽出語の出現回数リスト
文書2の抽出語の出現回数リスト
文書3の抽出語の出現回数リスト
先生のウェブサイトと『社会調査のための計量テキスト分析』では、
分かりませんでしたので、質問させていただきました。
ご多忙のところ、大変お手数をおかけいたしますが、よろしくお願いいたします。