ひとつの大きなファイルに、見出し1、見出し2の二つの階層の見出しをつけています。見出し1のレベルは、その部分の文書が発行された年を示しています。つまり見出し1が2013であれば、その部分の文書は、2013年に発行されたものということになります。
分析にあたって、この見出し1の中で、ある特定の年だけ抽出する、あるいは排除することができますか。
樋口先生の出版された教科書の例でいうと、「こころ」という小説を、見出しによって、上、中、下に分けていますが、そのうち、上だけ取り出すとか、上、中だけ分析対象として、下を対象から外す、といったことです。
よろしくお願いします。