Re: コード間の共起数など (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.183] Re: コード間の共起数など 投稿者:HIGUCHI Koichi  《URL》   投稿日:2006/06/27(Tue) 01:28:37

いつもお世話になります、樋口です。
書き込みありがとうございます。

あくまでとりあえずの対処ですが、以下のような方法が考えられます。

1)コード間で共起する文章の数

文書検索画面で、Ctrlを押しながらコードをクリックすることでコードを複数
選択し、(コードの)AND検索を行えます。これによって、一応、任意の2つの
コードが共に与えられた文書の数を知ることができます。

2)文章中の品詞の有無によってコードを与える

「ツール」→「SQL文入力」→「その他」で以下のようなSQLを実行します。
これは、各文書(段落)の中に副詞が含まれているかどうかを、0-1で出力
するSQLです。一行目の「副詞」という部分を変更することで、他の品詞に
も対応できます。

---------------------------------------------------------------------
SELECT  IF(SUM( IF( khhinshi.name = '副詞', 1, 0 ) ) > 0, 1, 0)
FROM dan, hyosobun, hyoso, genkei, khhinshi
WHERE
      dan.dan_id = hyosobun.dan_id
  AND dan.h5_id  = hyosobun.h5_id
  AND dan.h4_id  = hyosobun.h4_id
  AND dan.h3_id  = hyosobun.h3_id
  AND dan.h2_id  = hyosobun.h2_id
  AND dan.h1_id  = hyosobun.h1_id
  AND hyosobun.hyoso_id = hyoso.id
  AND hyoso.genkei_id = genkei.id
  AND genkei.khhinshi_id = khhinshi.id
GROUP BY dan.id
INTO OUTFILE 'c:\\temp.txt' FIELDS TERMINATED BY '\t'
---------------------------------------------------------------------

出力されたファイル(c:\temp.txt)の一行目に「副詞有無」といった変数名
を追加して保存します。そして、このファイルを外部変数ファイルとして(
段落単位に)読み込みます。

これによって、以下のようなルールを書けるようになります。

---------------------------------------------------------------------
*副詞無し
<>副詞有無-->0

*副詞有り
<>副詞有無-->1
---------------------------------------------------------------------

※もしコーディングの単位が段落単位でない場合は、その旨お知らせ下さいませ。
 少しSQL文も変わりますので・・・。


2)は一度この操作を行えば、それ以降は当該の外部変数を使えるのですが、、、
1)の方は結構面倒ですよね…。頻繁に1)についての確認が必要になったりします
でしょうか?


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)