[掲示板へもどる]
一括表示

  [No.1292] 複数の文書間の分析について 投稿者:Yokohama  投稿日:2013/02/24(Sun) 22:15:16

樋口先生、KHCoderを利用させて頂きありがとうございます。
下記についてサジェスチョンを頂ければ幸いです。
「問い合わせ」に対する「回答」の2つの文書から成るデータがあります。各々タグを付けて項目分けができると思いますが、2つの文書間の相関を分析したいと考えています。つまり、「問い合わせ」に対して、どのような「回答」があるので、各々特徴抽出して、それらの間の相関を調べるようなことはできますでしょうか。つまり、項目間で相互に関連する特徴語を表示するなど(「問い合わせ」で選択した特徴語と関連する特徴語が「回答」の中のどの特徴語と関連が深いのかといった分析を考えております)
文書データはひとつにまとめることが前提となっていると理解しておりますので、難しいのかなと思いますが、何か手はないものかと思案しており、ご多忙のところ恐れ入りますが、ご教示頂ければ幸いです。


  [No.1293] Re: 複数種類の文書群の対応(ex. 問い合わせ & 回答) 投稿者:HIGUCHI Koichi  投稿日:2013/02/24(Sun) 23:42:40

こんにちは、樋口です。書き込みありがとうございます。

ご面倒ですが、「問い合わせ」と「回答」で2つの別のファイル、別のプロジ
ェクトにするのが良いかと思います。この際には、両方のファイルのケース数
・並び順が一致するようにしておきます。※たとえば、「問い合わせ」ファイ
ルの前から10番目に対応する「回答」が、「回答」ファイルの前から10番目に
入っているようにします。

そして、「問い合わせ」データについて共起ネットワークやその他の分析を行
い、どんな問い合わせが多かったのかを探索します。さらに「こういう内容の
問い合わせにはコードAを付与」といったコーディングを行って、結果をCSVフ
ァイルとして出力します。

「回答」データを分析するためのプロジェクトに、外部変数として、上記コー
ディング結果を読み込みます。そうすれば、「コードAが付与された問い合わ
せへの回答には、こんな言葉が多い」といった分析が行えるようになります。

つまり、「問い合わせ」データの中から選択した特徴語Aをコード化していた
だくことで、「回答」側に持ち込み、Aと結び付きが深い「回答」側の語を探
索、という手順になります。

こちらのスレッドの内容もご参考になるかもしれません。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?&no=728&mode=allread


  [No.1294] Re: 複数種類の文書群の対応(ex. 問い合わせ & 回答) 投稿者:Yokohama  投稿日:2013/02/25(Mon) 22:53:35

樋口先生、早速にご回答頂きありがとうございます。
過去のスレッドにも類似の問い合わせがありましたこと恐縮です。
是非トライしたいと思います。
ありがとうございました。


  [No.1295] Re: 複数種類の文書群の対応(ex. 問い合わせ & 回答) 投稿者:HIGUCHI Koichi  投稿日:2013/02/26(Tue) 00:07:37

こんにちは、樋口です。

いえいえ、ご質問ありがとうございました。この掲示板のQ & Aも大部
たまってきましたから、全部チェックしないと質問できないというの
では不便すぎです。

ここの内容をもう少し「よくある質問ページ」に整理していけば良い
のでしょうが、ちょっと手が回っておらず、お手数をおかけしており
ます。

なにはともあれ、ご不明の点がございましたら、今後ともお気軽に掲
示板にポストなさってください。