Re: 接尾語と強制抽出・文字列指定 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.75] 接尾語と強制抽出・文字列指定 投稿者:HIGUCHI Koichi  《URL》   投稿日:2004/10/23(Sat) 21:35:57

こんにちは、樋口です。

KH Coderの仕様上、コーディングの難しいところです。
デフォルトでは、「自己責任論」の最後の「論」が、接尾語として
抽出されるために、「自己責任 & 論」というコーディングルールは
機能しません。接尾語は無視されるためです。

やり方はいくつか考えられますが、「自己責任論」と「自己責任」
の2つを強制抽出してはいかがでしょうか。なお、強制抽出の指定の
際には「自己責任論」を必ず先に指定して下さい。
上にあるもの(先に指定されたもの)の方が優先されますので、
「自己責任」が上にあると、「自己責任論」という文字列からは
「自己責任」と「論」が抽出されることになってしまいます。
(これはマニュアルには書いてないと思います。申し訳ありません。)

「自己責任論」と「自己責任」を強制抽出すれば、次のようなコー
ディングルールが動くはずです。

*自己責任論
  自己責任論
| '「自己責任」論'
| (
	  自己責任
	& (
		論じる
		| 論ずる
		| 問う
		| 糾弾
		| 問題
		| 論争 
	  )
  )

*自己責任
! <*自己責任論> & (
    自己責任
  | ( 自分 & 責任 )
)

「「自己責任」論」というのを強制抽出せずに、文字列指定で拾っ
ていますが、特に理由はありません。単に、あまり数がないので語
として抽出する必要は無いかなぁという程度のことです。
同様に「自己責任」についても、「自己+責任」のように連続して出
現している語を拾うためのコーディングルールでも拾えますし、
「'自己責任'」という文字列検索のコーディングルールでも拾える
はずです。ただ、数が多いので、語として抽出しておこうかという...

※文字列指定や、連続して出現している語の指定は、KH Coder 2.x
のコーディングルールに追加された新しい機能です。


なお、他の方法としては、「前処理」「語の取捨選択」「品詞によ
る語の取捨選択」で「その他」にチェックを入れる方法もあります。
こうすると、強制抽出をしなくても「自己+責任+論」という指定が
可能になります。
必ずしもこの方法をお勧めしているわけではありませんが、御参考
までに。

まだまだ、KH Coderには扱いにくい所が多くて申し訳ないですが、
また分かりにくい点などありましたら、お気軽に書き込みして下さ
いませ。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)