こんにちは、樋口です。書き込みありがとうございます。 またデータをお送りいただき感謝申し上げます。
まず、前処理を行なってからメニューの「前処理」「語の抽出結果を確認」を クリックし、<H1>を検索します。すると、添付のスクリーンショットのように、 1つ目の見出し行では<H1>の前に何らかの文字があったため、上手く見出しとし て認識されていないことが分かります。
今回の原因は、分析対象ファイルに「BOM」が含まれていたことでした。このBOM が、スクリーンショットの「?」として邪魔をしていたのです。対策としては、 BOMなしで保存すれば問題は解決します。あるいは、あまりお勧めではないのです が、最初の見出し行「<H1>2010</H1>」の前に改行を入れて上書き保存すれば、 BOMによる見出し行への影響がなくなって、ひとまずエラーは無くなりそうです。
※サクラエディタや秀丸エディタであれば、ファイル保存時にBOMの有無を選べま す。たぶんNotepad++でも大丈夫だと思います。
|