御著書拝読しました。大変勉強になりました。さて、KH coderに供する前の段階で、一般的にひらがな表記と現在、漢字表記の両方が使われるような語(ありがたい⇔有難い、いろんな⇔色んな、おいしい⇔美味しい、すごい⇔凄い、のぞく⇔除くor覗く etc.)については、後者に統一する作業をしています。これをしないと同じ語でも別々の品詞カテゴリーに分類されてしまうと思うのですが、そのような語は結構有り、なかなか面倒な作業です。何か良い手はないでしょうか。