Re: 表記揺れの吸収 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1011] Re: 表記揺れの吸収 投稿者:HIGUCHI Koichi  投稿日:2012/08/05(Sun) 15:07:08

こんにちは、樋口です。書き込みありがとうございます。

少し立て込んでいたのと、「どういう方法があるだろう」と考えを巡らすうち
に日数が経ってしまい、失礼いたしました。表記揺れに関してはコーディング
ルールの使用をお勧めする場合が多いのですが、この場合(文脈ベクトル)に
ついては対応できないですね。

■対処法
さて対処法ですが、(1) このファイルをダウンロード・解凍し、「plugin_jp」
フォルダにコピーして下さい。
http://khcoder.info/psnl/tmp/z1_edit_words.zip

そしてコピーしたファイルを「秀丸」等のテキストエディタで開き、下記のよ
うな部分(Perlのコード)を編集します。

my $config = {
    '友達' =>
        [
            '友人',
            '旧友',
            '親友',
            '盟友',
            '友',
        ],
    '愛' => 
        [
            '愛情',
            '愛人',
        ],
};

このままの設定ですと、「友人」「旧友」「親友」「盟友」「友」はすべて
「友達」に置換されます。また「愛情」「愛人」は「愛」に置換されます。

ここで指定できる語(置換前の語も、置換先の語も)は、すべてKH Coderに
語として抽出されているものだけです。とりわけ「友達」「愛」のような置
換先の語が存在しない場合は、処理がエラーになります。

(2)この部分に必要なだけ置換の指定を加えて、上書き保存します。そして
(3)「ツール」「プラグイン」「表記揺れの吸収」を実行して下さい。

※あらかじめ前処理が実行されている前提です。もし未実行の場合は(3)の
前に実行して下さい。

■注意点
この処理によって「友人」「親友」等の基本形は「友達」として認識、すな
わち「友人」「親友」等は、「友達」の1つの活用形として認識されるよう
になります。漱石「こころ」データでこの処理を行って、「抽出語検索」画
面で「友」を検索してみると分かりやすいと思います。

このように語の取り出し方が変わりますから、KH Coderのすべての処理結果・
計算結果が影響を受けます。そうした影響の大きさに比して、ややテストが
手薄ですので、結果を確認しながらお使いいただくのが安全でしょう。

なお、語Aを語Bに置換するといった指定を編集した場合、KH Coderを再起動
しないと編集が反映されませんのでご注意下さい。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)