Re: 同義語をまとめること (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.576] Re: 同義語をまとめること 投稿者:HIGUCHI Koichi  投稿日:2010/01/15(Fri) 15:58:26

こんにちは、樋口です。書き込みありがとうございます。

> 普通に語を抽出して分析するのとコーディングルールで指定して分析するの
> は別なプロセス?(段階?)ということなのですね。

そういうことになります。念のために書きますと、「段階」と書いているのは、
下記ページに解説がある「段階1」と「段階2」のことです。

主な機能と分析手順: http://khc.sourceforge.net/diagram.html

> コーディングルールで指定した語を第1段階での分析に組み込むことができ
> ないということは,以下のことができないという理解でよいでしょうか。
> そして,以下のようなことをしたい場合に,何か方法はあるのでしょうか。
>(それぞれ別単語とするか,テキストファイルの状態で置換するしかないの
> でしょうか。)
> ・「おどろき」と「驚き」と「オドロキ」の3つをとコーディングルールで
> 「おどろき」と指定して,他の自動抽出された語と同じレベルで分析する。

お書きいただいたとおり、「できない」という理解で正しいかと存じます。分
析の段階1では「語Aと語Bを同じものとみなそう」といった操作は行いにくい
ように、KH Coderを設計しております。これは、意図的に、行いにくいように
しております。と言いますのも、同じものと見なせそうな語をデータ全体にわ
たって探すような「手作業」は労力的にも大変ですし、まとめる基準が作業中
にゆらがないとも限りません(特にデータが大きい場合には)。

そうしたことから、(i)段階1における抽出語の分析は「手作業」を排した状態、
極力バイアスフリーな状態で行い、その次の段階2で、(ii)どうしても必要な
最少限の言葉・概念だけをコードとして拾おうという考え方が、KH Coderには
内包されています。また、機械的に取り出した抽出語と、分析者の観点を反映
する(こともある)コードとの、不用意な混同を避けたいという考えもござい
ます。

※1 こうした分析の考え方につきまして、もしもご関心がございましたら、下
記論文にもう少し詳しく記してございます。
http://www.jstage.jst.go.jp/article/ojjams/19/1/101/_pdf/-char/ja/


さて、そうは申しましても、KH Coderのようなツールがいったん制作者の手を
離れましたら、その使用法はお使い下さる方のお考え次第です。また、制作者
の想定の範囲を超えるようないろいろな方法が試みられてこそ、分析方法&ツ
ールが発展するものだと思います。

お書きいただいたような分析を行う方法としては、コーディングルールをお使
いただくのが手かもしれません。(手作業では大変ですのでなるべくエディタ
の置換機能等を使って)以下のようなコーディングルールをお作りいただくと
いう方法です。

> *おどろき
> おどろき or 驚き or オドロキ
>
> *語1
> 語1
>
> *語2
> 語2
>
> *語3
> 語3

分析に使われるのが100語200語といった程度でしたら、コードの数が多すぎる
ことに起因するエラーは生じないはずです。こうしたコーディングルールをい
ったんお作りいただきますと、コーディング結果を使ってKH Coder上で多変量
解析を行うこともできますし、コーディング結果をSPSS等に出力していただく
こともできます。

それではよろしくお願いいたします。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)