新聞記事を用いた分析を行っています。<H1>2000年</H1><H2>01月01日</H2><H3>見出し</H3>本文といった形でテキストファイルで見出しを付けたのですが、集計単位にH1 が出て来ません。また、クラスター分析にもH2、H3などのタグが出てきてしまいます。タグ自体は確認し、全て問題はないのですが、何が原因でしょうか。