[掲示板へもどる]
一括表示

  [No.468] タグごとの関連語探索 投稿者:kina  投稿日:2009/08/20(Thu) 16:36:02

何度もお手数おかけ致します。

抽出語→関連語探索によって4時期の関連語を比べようとしております。「・コード選択」欄に「*1985年〜1990年」などが表示されるものの、集計単位を文にして、コード部分をダブルクリックしても結果表示されません。

ちなみに、分析対象ファイル内のタグは、
<h3>1985年〜1990年</h3>
のような形にしております。

また、それを抽出するためのコーディングルールは以下のように書いております。

*1985年〜1990年
<>見出し3-->1985年〜1991年

*1991年〜1996年
<>見出し3-->1991年〜1996年

*1997年〜2002年
<>見出し3-->1997年〜2002年

*2002年〜2008年
<>見出し3-->2002年〜2008年

間違っているところをご指摘下さいますなら幸いです。


  [No.469] Re: タグごとの関連語探索 投稿者:HIGUCHI Koichi  投稿日:2009/08/20(Thu) 17:05:48

こんにちは、樋口です。書き込みありがとうございます。

これが上手くいかないと、「部分テキストの取り出し」もできないで
しょうから、なんとかしなくては、というところですね。

さて、基本的にはお書きいただいたような方法で上手くいくはずです。
掲示板への書き込み時のミスかなと思うのですが、見出しとコーディン
グルールが一致していないのが気になるくらいでしょうか。
> 1985年〜1990年(見出し)
> 1985年〜1991年(コーディングルール)

どうしても上手くいかなければ、見出しとコーディングルールともに、
> 85-90
といったシンプルなもの(それも半角文字に統一して)に変えて、お試
しいただくと良いかもしれません。


あとは予断になりますが、データが新聞記事ですので、文単位ではなく
記事単位(h5単位)で計算するのも一手かもしれません。文単位だと、
それぞれの文の中に、各語が出現する確率を見るわけですが、記事単位
(h5単位)にすると、それぞれの記事の中に語が出現する確率を見る
ことになります。十分な記事数があれば、記事単位での計算を試して
見られるのも良いかもしれません。


  [No.470] Re: 関連語探索結果の保存 投稿者:kina  投稿日:2009/08/20(Thu) 18:32:09

ご説明ありがとうございました。
ご指摘のとおりコーディングルールの入力ミスでした。
ご提案いただいた集計単位をh5にするのも試してみます。

またも申し訳ありませんが、関連語検索結果の保存についてお伺いいたします。

関連語検索結果は自動的にcoder_dataに保存されてはいないようですし、かといって保存ボタンもないようですが、こういう場合に結果を保存したり印刷したい場合、良い方法がございますでしょうか。

画面をプリントスクリーンでワードに貼れば最低の用は足りるのですが、もっと良いやり方があればお教えいただけませんでしょうか。


  [No.471] Re: 関連語探索結果の保存 投稿者:HIGUCHI Koichi  投稿日:2009/08/20(Thu) 18:42:11

こんにちは、樋口です。書き込みありがとうございます。

関連語探索の結果ですが、検索のたびに、上位10〜20程度を選択して
コピーし、Excel等に貼り付けていただくのが良いかと思われます。

選択は、結果の1行目からマウスをドラッグする(クリックしたまま
下に動かす)ことで行えます。またコピーはWindow左下隅のボタンか
Ctrl+Cキーで行えます。


なお、結果のうち、最終的に示すのは抽出語とJaccard係数くらいで
十分かと思われます。例えば私の場合、「死ぬ」「原爆」「戦争」
などのキーワード(文中ではテーマ語と呼んでいます)と関連のある
語を探索して、以下のような表にまとめています:
http://d.hatena.ne.jp/iDES/20060925/1159186200
(もちろん、品詞やその他の数値を添えていただくのも、お好み次第
ですが…)


  [No.472] Re: 関連語探索結果の保存 投稿者:kina  投稿日:2009/08/20(Thu) 23:29:03

お返事ありがとうございました。

細かく教えていただいたのに従って、Excelにコピーすることができました。

さらに、はだしのゲンでの結果表示を見せていただいて、項目を絞った表示にしようと思いました。
ご親切に表示例をご紹介いただき、ありがとうございました。

今後ともよろしくお願い致します。