[掲示板へもどる]
一括表示

  [No.1979] 表記揺れについて 投稿者:Kosugitti  投稿日:2015/02/25(Wed) 16:57:23

KH Coder,とある研究で本格的に使わせていただくことになりました。
みんなでじっくり触りながら,ソフトの長所,作者の先生のお考えなどがわかるようになってきました。

誤解であればご指摘いただきたいのですが,実際のインタビューデータの逐語録を使っていて困るのは,表記揺れに関することです。

表記揺れはかつてのこちらのスレッドで,プラグインコードを提供してくださっていますので,それを使って対応しています。

が,本来はコーディングして使うべきところを表記揺れとして取り込まざるを得ないシーンがあります。
例えば,カテゴリーとしては「お祭り」なのですが,会話の中では様々な表現がされているというときに,コーディングでその揺れを吸収すると,コーディングワードと他のキーワード,外部変数との対応とが同じレベルでできないからです。

サンプルのような,同じ著者による表現であれば揺れはある程度少ないでしょうし,あるいは表現揺れに意味があるところと思います。
ところが複数人の会話データいなると,表記揺れの吸収=カテゴライズすることになってしまって,それをperlのコードレベルでやるのは少し不便に感じます。

KH Coderは使ってみて本当に便利なソフトウェアだと思いました。
本件はKH Coderの長所をスポイルするものではないでしょう。
こちらの誤解,誤用がありましたらご指摘ください。

今後ともよろしくお願いいたします。


  [No.1982] Re: 表記揺れについて 投稿者:HIGUCHI Koichi  投稿日:2015/02/25(Wed) 19:48:30

こんにちは、樋口です。書き込みありがとうございます。

私自身の現時点での立場としては、表記揺れの吸収という作業には、分析者そ
れぞれの考え方や立場、あるいは分析の目的が反映されうると考えています。
それも相当に複雑な形で、です。そういった作業を経て取り出されたもの(コー
ド)と、機械が自動的に取り出したもの(語)を、無自覚に混ぜるのは推奨で
きないという考えから、現在の仕様となっております。(より詳しくは「KH
Coderの本」第2章終わりのあたりです)

ですので現在の仕様ですと、たとえば以下のようなコーディングルールを作成
していただき、分析に使う語を100から200程度すべて含めるという手順になり
ます。その上で「ツール」→「コーディング」メニューの分析機能をお使いい
ただけば、おそらく、一通りの分析が可能ではないかと考えております。

> *表記ゆれを吸収した語1
> 語A or 語B
>
> *表記ゆれを吸収した語2
> 語C or 語D
>
> *語1
> 語1
>
> *語2
> 語2
>
> *語3
> 語3

とはいえ、それではあまりに不便と言うことでしたら、もちろん再考させてい
ただく所存です。上記のようなコーディングルールをお使いいただく方法では、
問題がございますでしょうか?


なお、先にお書きいただいたのは、こちらのスレッドで行なっているような表
記揺れの吸収を、GUIで簡便に行えればということですね。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=1010&mode=allread#1010

上記のようなコーディングルールを書けばいずれ実現できることなのだから、
もっと簡単にできるようにしても良いではないか。あるいは、コーディング
ルール同様、表記ゆれ吸収の内容をきちんと明示するなら、こうした形で表記
ゆれを吸収できても良いではないか。そういった考え方もあるかもしれないの
ですが、冒頭に書きました開発ポリシーとの折り合いがつくかな…、と迷いを
感じているところです。

以上、ひとまずのご返信までに。


  [No.1990] Re: 表記揺れについて 投稿者:Kosugitti  投稿日:2015/03/03(Tue) 15:24:35

Kです。

色々ありましてお返事に気づいておりませんでした。失礼いたしました。
早々のお返事ありがとうございます。

我々も使いながら,これは設計思想だから我々が合わせた方がいいね,と了解しております。扱っているデータが二つの地域ににおける10数名のインタビューデータですので,方言や地域の固有名など,何処かの抽象的なレベルで統一する必要がでてくるのです。
抽象度が等質かどうか(カテゴリーが広すぎる?狭すぎる?)という問題が常に生じますので,先日は研究チームで合宿を組んで,数日間にわたって表記ゆれ(?)対策をしました。

そこでの苦労を考えると,そのあと.pmファイルを書き換えるぐらいはなんてことはないのです。が,もし今後の展開として対応が可能であれば,あるいは他でもこうした用途でのニーズがあれば,ご検討いただければと思いました。

お返事まで。


  [No.1993] Re: 表記揺れについて 投稿者:HIGUCHI Koichi  投稿日:2015/03/03(Tue) 23:47:47

こんにちは、樋口です。ご丁寧にありがとうございます。

お使い下さる方の利便性は重要なポイントですので、考えさせていた
だきたいと思います。

「前処理」メニューへの追加は苦しくても、「プラグイン」としての
追加はあるかもしれません。

すぐにとはまいりませんが、気長にご覧いただけましたら幸いです。