[掲示板へもどる]
一括表示

  [No.865] 動詞と動詞B、名詞と名詞B、C等の併合 投稿者:tomosk  投稿日:2011/10/29(Sat) 16:15:11

現在文章解析をするにあたってこちらのソフトを使わせて貰っています。

非常に便利なソフトなのですが、度数数える際に動詞と動詞B、名詞と名詞B、Cなど漢字とひらがなで別々に集計されたものを合体させる効率的な方法はあるのでしょうか?
短い文章だと手作業でも問題ないのですが膨大なデータになると手作業では追いつかないので、もしご存知でしたらご教授お願いします。


  [No.866] Re: 動詞と動詞B、名詞と名詞B、C等の併合 投稿者:HIGUCHI Koichi  投稿日:2011/10/29(Sat) 19:42:37

こんにちは、樋口です。書き込みありがとうございます。

例えば、「色々」と「色色」と「いろいろ」の合計を数えたいということでし
ょうか? だとしますと、コーディングを行っていただくのが比較的便利かと
思います。例えば以下のようなコーディングルールで、文の数を数えることが
考えられます。

#---------------------------------------------------------------------
*色々
色々 or 色色 or いろいろ

*遊ぶ
遊ぶ or あそぶ
#---------------------------------------------------------------------

コーディングの段階(段階2)では、分析する方の方針に従って、こうした合
併を自由に行っていただけるようにしております。

それに対して、語の分析の段階(段階1)では、恣意的になってしまう可能性
もある合併の操作は、行いにくいように設計しております。例えば、漢字で書
かれた語と、ひらがなで書かれた語には、異なる特徴なり出現パターンなりが
あるかもしれません。

そうした考え方について詳しくは「KH Coderの主な機能と分析手順」ページや、
チュートリアル等をご覧下さい。
http://khc.sourceforge.net/diagram.html


  [No.867] Re: 動詞と動詞B、名詞と名詞B、C等の併合 投稿者:tomosk  投稿日:2011/10/29(Sat) 20:27:35

お返事ありがとうございます。

おっしゃられている通り「色々」と「色色」と「いろいろ」の様な単語の度数の合計を数えたいと思っています。

ただツール‐抽出語‐抽出語リストでエクセルに出力する結果で合併したいと考えていたのですが、これは「段階1」での処理なので行えないようになっているのでしょうか?


  [No.870] Re: 動詞と動詞B、名詞と名詞B、C等の併合 投稿者:HIGUCHI Koichi  投稿日:2011/10/30(Sun) 12:53:19

こんにちは、樋口です。書き込みありがとうございます。

はい、残念ながらお書きの通りです。抽出語リストは「段階1」に含まれる処理
なので、お書きいただいたような語の合併はできません。

「強いて」ということでしたら、頻出150語の表を縦につないでいただいて、
そこにエディタによる置換処理を加えることで、以下のようなコーディング
ルールを(半自動的に)作成するのが一手かもしれません。

----------------------------------------------------------------------
*語A
語A

*語B
語B

*語C
語C
----------------------------------------------------------------------

その上で、必要な併合を「or」で書き加えます。

現状のKH Coderでは、こうした方法が比較的効率的かと思われます。


  [No.871] Re: 動詞と動詞B、名詞と名詞B、C等の併合 投稿者:tomosk  投稿日:2011/10/30(Sun) 17:11:06

回答ありがとうございます。
コーディングルールをそのように用いることもできるのですね。
とても便利なツールなので、色々な方法を検討したいと思います。

ありがとうございました。