こんにちは、樋口です。書き込みありがとうございます。
『言語研究のための統計入門』は素晴らしい御本ですね。なお、すでにご存知
かとは思いますが、KH Coderで複数ファイルの分析を(繰り返し操作なしに)
行う方法をこちらにまとめています。
『言語研究のための統計入門』 & KH Coder
http://khc.sourceforge.net/kuroshio.html
さてカタカナ語の検索ですが、添付のスクリーンショットのような形でExcel
をお使いいただくのが、現状では比較的手軽かと思います。
まず、KH Coderのメニューから「ツール」「抽出語」「抽出語リスト」を選び、
「一列」を選択したうえで「OK」をクリックします。
あとはExcel上で、カタカナを含むかどうかをチェックする列を追加します。
まず、「開発」リボンで「Visual Basic」をクリックします。「Microsoft Vi
sual Basic」というタイトルの画面が開くので、メニューから「挿入」「標準
モジュール」をクリックします。そして白い編集欄に以下のコードをペースト
します。ペーストすれば「Microsoft Visual Basic」画面は閉じてしまって結
構です。
Function RegMatch(Regex, TargetText)
Dim re As Object
Set re = CreateObject("VBScript.RegExp")
re.Pattern = Regex
RegMatch = re.Test(TargetText)
End Function
もとのExcel画面で、
D2セルに =RegMatch("[ァ-ヶー]",A2)
E2セルに =RegMatch("^[ァ-ヶー]+$",A2)
と入力します。この入力した2つのセルを下の方の行までコピー&ペーストす
れば完了です。あとはExcelのフィルタ機能でTRUEの行だけを表示させれば、
添付のスクリーンショットのようになります。なお、上記の手順はExcel 2002
と2007で確認しました。
|