Re: 解析前の語の漢字およびかな表記の統一 (中川祥治) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.2193] 解析前の語の漢字およびかな表記の統一 投稿者:   投稿日:2015/09/19(Sat) 10:49:36

御著書拝読しました。大変勉強になりました。
さて、KH coderに供する前の段階で、一般的にひらがな表記と
現在、漢字表記の両方が使われるような語(ありがたい⇔有難い、
いろんな⇔色んな、おいしい⇔美味しい、すごい⇔凄い、のぞく
⇔除くor覗く etc.)については、後者に統一する作業をしてい
ます。これをしないと同じ語でも別々の品詞カテゴリーに分類
されてしまうと思うのですが、そのような語は結構有り、なか
なか面倒な作業です。何か良い手はないでしょうか。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)