Re: 関連語検索について[追記あり] (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1596] Re: 関連語検索について[追記あり] 投稿者:HIGUCHI Koichi  投稿日:2014/03/13(Thu) 17:46:14

こんにちは、樋口です。

書き込みありがとうございます。
またKH Coderの本を手にとっていただいてありがとうございます。

さて、kokoro2.txtの場合ですと、「<H1>上_先生と私</H1>」のような、H1タ
グを使った「見出し」(見出し1)があります。この見出しを「上」「中」「
下」の開始箇所(3箇所)に入力することで、データ全体を「上」「中」「下
」の3つの部分に区切っています。模式的にあらわしますと、以下のような形
になっています。

> <H1>上_先生と私</H1>
> ・・・「上」の本文・・・
>
> <H1>中_両親と私</H1>
> ・・・「中」の本文・・・
>
> <H1>下_先生と遺書</H1>
> ・・・「下」の本文・・・

この形をとることによって、「上」の関連語≒「『上』に特に多く出現する語
」を探すといったことが可能になっています。H1の見出しを使いたいので、図
3.7の(2)では「見出し1」をクリックしています。そうするとKH Coderは、「
見出し1」(H1タグを付した見出し)で区切られた各部分について、特徴語≒
特に多く出現する語を探します。

※なおH1で区切った3つの部分を、さらに細かく区切るためにH2を使っていま
すが、ここではH2は関係ありません(使用していません)。

ここで、H1とH2の見出しだけになって、本文がなくなってしまうと、「『上』
に特に多く出現する語」がほとんどなくなってしまうために、結果が空になっ
たものと思います。

ご自身のデータで結果が出ないという点についても、おそらくは、データ準備
ないしはデータ形式が原因となっているのではないかと、現時点では思われま
す。

以上のような説明で何か伝わりますでしょうか。もし思い当たる点がおありで
したら、ご自身のデータを修正してお試しいただければと思います。また、そ
うでなければ、具体的にどんな形でデータをご準備なさったかをお知らせいた
だければ、もう少しこちらから書けることがあるかもしれません。

[追記]
ご自身でデータを準備された場合、前処理の前に「分析対象ファイルのチェッ
ク」を実行していただくと良いかもしれません。何か見つかった場合は「自動
修正」の「実行」をクリックしてください。

あと、H1タグで括る見出し部分ですが、半角文字や半角記号やスペースが入っ
ている場合、それらを削除してみていただくと、何か変わるかもしれません。
最近チェックできていないのですが、もしかすると特定の記号等が入っている
場合、検索に失敗して結果が空になるということがあるかもしれません。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)