[掲示板へもどる]
一括表示

  [No.2189] 特定の階層の見出しの一部だけの取り出し 投稿者:S. Yamada  投稿日:2015/09/14(Mon) 20:31:39

ひとつの大きなファイルに、見出し1、見出し2の二つの階層の見出しをつけています。見出し1のレベルは、その部分の文書が発行された年を示しています。つまり見出し1が2013であれば、その部分の文書は、2013年に発行されたものということになります。

分析にあたって、この見出し1の中で、ある特定の年だけ抽出する、あるいは排除することができますか。

樋口先生の出版された教科書の例でいうと、「こころ」という小説を、見出しによって、上、中、下に分けていますが、そのうち、上だけ取り出すとか、上、中だけ分析対象として、下を対象から外す、といったことです。

よろしくお願いします。


  [No.2190] Re: 特定の階層の見出しの一部だけの取り出し 投稿者:HIGUCHI Koichi  投稿日:2015/09/15(Tue) 21:55:48

こんにちは、樋口です。書き込みありがとうございます。

現在の所、データの一部だけに注目するという機能は備えておりません。

お手数ですが、特定の年の文書だけを含むテキスト・ファイルを作成して、こ
れを新たなプロジェクトとして登録してください。漱石の「こころ」で申しま
すと、「上」だけを含むテキスト・ファイルを作成して、新たなプロジェクト
として登録するといった形です。

特定の年の文書だけを取り出して、新たなテキスト・ファイルを作成するには、

> ○○年
> <>見出し1-->○○

といったコーディングルールを作成した上で「部分テキストの取り出し」コマ
ンドを使用できます。ただ、年の順に文書が並んでいる場合には、このコマン
ドを使わず、単にテキストエディタでコピー&ペーストをした方が早いかもし
れません。