Re: 「ポジティブ」「ネガティブ」といった文意の分析について (袋井) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.931] Re: 「ポジティブ」「ネガティブ」といった文意の分析について 投稿者:袋井  投稿日:2012/03/18(Sun) 19:42:30

樋口先生さま

お世話になります、袋井と申します。


質問者の目線に立った的確でわかりやすいご説明、
更に質問者の期待を超える役に立つご教示をいただき、
ありがとうございました。


> 人間が考えるための補助、判断するための補助になるような、
> 自動処理・可視化・集計をどれだけできるかというのが
> KH Coder制作時によく考えていることです。

いいお話を伺うことができました。

私もソフトの自作をすることはございますが、
設計方針をお聞きするというのは大変に参考になります。
ありがとうございました。



> コーディングルールを書くことで分類の基準を記録して手元に残すことができます。

> 学術用途であれば、これらのメリットのために労力をさく価値はあると考えています。


分類基準の仕様をコーディングルールとして明示化することは、とても意義があると思います。

しかし、
私が企業人であり、対象が質の良くない大量データであることを考えると(お客さま対応のコールセンターなどの入電など)
どこまで労力を投入できるか、自信はありません。



> 機械学習は精度がどこまで出るかという点が未知数なのですが、
> コーディングよりは労力が少なく、より多くのデータに対応できる可能性が
> あります。
>
> RなりWekaなりをご自身で操作していただく必要があります。

Rは毎日コーディングしています(自宅でも会社でも)。
Wekaもお気に入りの道具の一つです。

余談となりますが、
機械学習には強い興味があり、色々なソフトを触っていた時期がございます。


機械学習を適用する前提条件として、以下を考えたいと思います。

> その場合、テキストからポジティブ・ネガティブをくみ取る部分は、
> 正確を期すならば、人間が一定の労力をさく必要があるでしょう。

文意を表すタグや意味フラグなどを付与することは、機械学習の計算精度に大きく貢献しますので、
ここは、人手で労力をかける価値があると考えます。



> 事前の探索のための可視化を行い、
> 「これらの語を使えば、多くの文書にコードを効率的に付与できるんじゃないか」
> といったあたりをつけるところでしょうか。

上述しました、文意を表すタグや意味フラグなどの手がかりを得ることに、
事前調査で可視化をうまく活用することを考えたいと思います。


貴重なご助言をいただきまして、誠にありがとうございました。
心より御礼を申し上げます。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)