Re: 表記揺れについて (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1982] Re: 表記揺れについて 投稿者:HIGUCHI Koichi  投稿日:2015/02/25(Wed) 19:48:30

こんにちは、樋口です。書き込みありがとうございます。

私自身の現時点での立場としては、表記揺れの吸収という作業には、分析者そ
れぞれの考え方や立場、あるいは分析の目的が反映されうると考えています。
それも相当に複雑な形で、です。そういった作業を経て取り出されたもの(コー
ド)と、機械が自動的に取り出したもの(語)を、無自覚に混ぜるのは推奨で
きないという考えから、現在の仕様となっております。(より詳しくは「KH
Coderの本」第2章終わりのあたりです)

ですので現在の仕様ですと、たとえば以下のようなコーディングルールを作成
していただき、分析に使う語を100から200程度すべて含めるという手順になり
ます。その上で「ツール」→「コーディング」メニューの分析機能をお使いい
ただけば、おそらく、一通りの分析が可能ではないかと考えております。

> *表記ゆれを吸収した語1
> 語A or 語B
>
> *表記ゆれを吸収した語2
> 語C or 語D
>
> *語1
> 語1
>
> *語2
> 語2
>
> *語3
> 語3

とはいえ、それではあまりに不便と言うことでしたら、もちろん再考させてい
ただく所存です。上記のようなコーディングルールをお使いいただく方法では、
問題がございますでしょうか?


なお、先にお書きいただいたのは、こちらのスレッドで行なっているような表
記揺れの吸収を、GUIで簡便に行えればということですね。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=1010&mode=allread#1010

上記のようなコーディングルールを書けばいずれ実現できることなのだから、
もっと簡単にできるようにしても良いではないか。あるいは、コーディング
ルール同様、表記ゆれ吸収の内容をきちんと明示するなら、こうした形で表記
ゆれを吸収できても良いではないか。そういった考え方もあるかもしれないの
ですが、冒頭に書きました開発ポリシーとの折り合いがつくかな…、と迷いを
感じているところです。

以上、ひとまずのご返信までに。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)