[掲示板へもどる]
一括表示

  [No.2507] クラスター分析について 投稿者:   投稿日:2016/06/10(Fri) 17:28:42

質問です。

ユーザーレビューのテキストマイニングをしています。
クラスター分析でクラスター化された言葉の群のニュアンスの共通性などを考慮して、
群に名前をつけたいのですが、例えば、「機能に対する評価」などとして共通化するときに、KHcoder上、何か勘案すべきルールやヒントなどはありますでしょうか?
別の尋ね方をしますと、このクラスター化されたものは、共起の強さをグラフ的に表しているだけなのでしょうか?

どなたか教えて頂けますと幸いです。


  [No.2509] Re: クラスター分析について 投稿者:HIGUCHI Koichi  投稿日:2016/06/10(Fri) 21:17:18

こんにちは、樋口です。書き込みありがとうございます。

クラスターに名前を付けるというのは良い戦略だと思います。

ただ、命名の仕方については、そのクラスターに分類された語を見ることと、
それらの語がデータ中でどのように使われていたかをKWICで見ること以外に、
これといった決まりは無いように思います。

> このクラスター化されたものは、共起の強さをグラフ的に表しているだけな
> のでしょうか?

おおむね、そうした感じだと思います。
ほかに何か、あらわしているものがあるとお考えでしょうか?


  [No.2510] Re: クラスター分析について 投稿者:   投稿日:2016/06/11(Sat) 16:42:54

樋口様、

御返信有難うございます。

> こんにちは、樋口です。書き込みありがとうございます。
>
> クラスターに名前を付けるというのは良い戦略だと思います。
⇒「戦略」という言葉の意図は、研究を進めていくうえで良い方法論だということでしょうか?
あるいは、それ以外の意図で使われたのでしょうか? 

> ただ、命名の仕方については、そのクラスターに分類された語を見ることと、
> それらの語がデータ中でどのように使われていたかをKWICで見ること以外に、
> これといった決まりは無いように思います。
>
> > このクラスター化されたものは、共起の強さをグラフ的に表しているだけな
> > のでしょうか?
⇒今のところまだ発見できておりません。クラスター化された共起の強い言葉群が意図するところは、マーケティング上なにかヒントがあるのではと思っていますが、
その論理性の作り方で悩んでいます。


> おおむね、そうした感じだと思います。
> ほかに何か、あらわしているものがあるとお考えでしょうか?


  [No.2512] Re: クラスター分析について 投稿者:HIGUCHI Koichi  投稿日:2016/06/15(Wed) 12:53:26

こんにちは、樋口です。書き込みありがとうございます。

「良い方法だ」という意味で書きました。
それ以外に特に意味はありません。

分析結果の意味を考えるという部分は、確かに非常に重要な
部分であると同時に、難しい部分でもあると思います。
悩ましいのですが、同時に、悩むだけの価値もあるように思
います。※この段落はただの感想で、何か特段の意図がある
わけではありません。


  [No.2514] Re: クラスター分析について 投稿者:   投稿日:2016/06/15(Wed) 22:48:37

樋口様、ありがとうございます。

それでは、共起関係の強い二つの言葉(例えば「友達」「楽しい」)を
エクセルに抽出する方法はありますでしょうか?⇒言い換え得れば、
共起ネットワークのJaccard係数の大きい順にリスト化するなど
できますでしょうか?もしできましたら、教えて下さい。





> こんにちは、樋口です。書き込みありがとうございます。
>
> 「良い方法だ」という意味で書きました。
> それ以外に特に意味はありません。
>
> 分析結果の意味を考えるという部分は、確かに非常に重要な
> 部分であると同時に、難しい部分でもあると思います。
> 悩ましいのですが、同時に、悩むだけの価値もあるように思
> います。※この段落はただの感想で、何か特段の意図がある
> わけではありません。


  [No.2515] Re: クラスター分析について 投稿者:HIGUCHI Koichi  投稿日:2016/06/15(Wed) 23:13:07

こんにちは、樋口です。書き込みありがとうございます。

こちらのスレッドがご参考になるかと思います。
http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=551&mode=allread

いったん「共起ネットワーク」を作成して、それからRで、という
操作です。


  [No.2517] Re: クラスター分析について 投稿者:   投稿日:2016/06/16(Thu) 20:11:55

樋口様、

毎度有難うございます。大変助かります。また引き続き宜しくお願い致します。

> こんにちは、樋口です。書き込みありがとうございます。
>
> こちらのスレッドがご参考になるかと思います。
> http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=551&mode=allread
>
> いったん「共起ネットワーク」を作成して、それからRで、という
> 操作です。


  [No.2531] Re: クラスター分析について 投稿者:   投稿日:2016/07/04(Mon) 21:16:34

> こんにちは、樋口です。書き込みありがとうございます。
>
> こちらのスレッドがご参考になるかと思います。
> http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=551&mode=allread
>
> いったん「共起ネットワーク」を作成して、それからRで、という
> 操作です。

樋口様、

ありがとうございます。頂いた、スレッドに従って、Rで操作してみました。共起ネットワークをうまく、Jacard係数の強い順に並べることできたのですが、
最後のこれをエクセルファイルに落とすところだけがうまくできません。以下のようなエラーメッセージがでます。
なぜか教えて頂けないでしょうか。

> write.table(ep, "c:/temp.csv", quote=F, append=F, sep=",")
以下にエラー file(file, ifelse(append, "a", "w")) :
コネクションを開くことができません
追加情報: 警告メッセージ:
In file(file, ifelse(append, "a", "w")) :
ファイル 'c:/temp.csv' を開くことができません: Permissio


  [No.2532] Re: クラスター分析について 投稿者:HIGUCHI Koichi  投稿日:2016/07/05(Tue) 12:25:12

こんにちは、樋口です。書き込みありがとうございます。

> ファイル 'c:/temp.csv' を開くことができません: Permissio

Cドライブの直下に「temp.csv」というファイルを作ろうとしているのですが、
ファイル作成(書き込み)権限がないために失敗しているようですね。

> write.table(ep, "c:/khcoder/temp.csv", quote=F, append=F, sep=",")

このように、Cドライブ直下以外の場所を指定してみてはいかがでしょう。
この例ではCドライブの中の「khcoder」というフォルダに、「temp.csv」を
作ろうとしています。※「khcoder」というフォルダがなければ失敗します。


  [No.2682] Re: クラスター分析について 投稿者:としゆき  投稿日:2016/10/23(Sun) 23:17:36

樋口様、

大分時間がたっておりますが、一つ確認しつぃことが出てまいりましたので質問させてください。

このスレッドの説明にあるjaccardの類似性測定という解釈は、数字が大きければおおきいほど、打ち出される二つの単語が一緒に登場する文章の数が多いと考えてよろしいでしょうか?




> こんにちは、樋口です。書き込みありがとうございます。
>
> こちらのスレッドがご参考になるかと思います。
> http://khcoder.info/cgi-bin/bbs_khn/khcf.cgi?no=551&mode=allread
>
> いったん「共起ネットワーク」を作成して、それからRで、という
> 操作です。


  [No.2683] Re: クラスター分析について 投稿者:HIGUCHI Koichi  投稿日:2016/10/23(Sun) 23:23:30

こんにちは、樋口です。書き込みありがとうございます。

2つの語が共起する傾向が強いかどうかをJaccard係数で測っている
ということです。

係数が大きくなれば共起する傾向は強まりますが、単純な共起の数
が多いかどうかは、それぞれの語の全体での出現数なんかにも依存
するので一概に言えません。

詳しくはこの係数の式を見ていただくのが確実かと思います。
http://amzn.to/2ed26u6


  [No.2749] 共起ネットワークのエラー 投稿者:   投稿日:2016/11/29(Tue) 10:24:05

共起ネットワークのエラー (画像サイズ: 1920×1080 404kB)

樋口さま、

お世話になっております。
共起ネットワークを作成しようとしたら添付のようなエラーが出ました。
テキストデータが多すぎるのでしょうか?もし考えられる原因ありましたら御教授頂けますと幸いです。


  [No.2750] Re: 共起ネットワークのエラー 投稿者:HIGUCHI Koichi  投稿日:2016/11/29(Tue) 11:16:58

こんにちは、樋口です。書き込みありがとうございます。

お書きになった「共起ネットワーク」とは、抽出語の共起ネットワークでしょ
うか?

どういう操作をしたらこのエラーが出るのかを、可能な限り詳しくお教えいた
だくことはできますでしょうか。またお使いになっているKH Coderのバージョ
ンもお書きください。

KH Coderのバージョンはについてはメニューから「ヘルプ」「KH Coderについ
て」とたどることで確認できます。


  [No.2766] Re: 共起ネットワークのエラー 投稿者:   投稿日:2016/11/30(Wed) 22:17:49

> こんにちは、樋口です。書き込みありがとうございます。
>
> お書きになった「共起ネットワーク」とは、抽出語の共起ネットワークでしょ
> うか?
>
> どういう操作をしたらこのエラーが出るのかを、可能な限り詳しくお教えいた
> だくことはできますでしょうか。またお使いになっているKH Coderのバージョ
> ンもお書きください。
>
> KH Coderのバージョンはについてはメニューから「ヘルプ」「KH Coderについ
> て」とたどることで確認できます。

樋口様、
ご返信ありがとうございます。PCの環境のせいだったのか、正常に作動致しました。
ありがとうございました。


  [No.2774] 出現頻度算出におけるデータ行列について 投稿者:   投稿日:2016/12/02(Fri) 15:51:15

樋口様、

毎度お世話になっております。また新しいトピックで質問させてください。
KHコーダーで算出した頻度別の単語個数を列に、行はアンケートの個人IDで
行列をCSVで出したいのですが、やはりRでつながないとできませんでしょうか?
もし、Rのプログラムのやり取り等このチュートリアルでなされてたものがあれば、
是非参考にさせていただけないでしょうか。

要は、主成分分析に持ち込む前のデータ行列関数がKHcoder
で取れればというものです。



> > こんにちは、樋口です。書き込みありがとうございます。
> >
> > お書きになった「共起ネットワーク」とは、抽出語の共起ネットワークでしょ
> > うか?
> >
> > どういう操作をしたらこのエラーが出るのかを、可能な限り詳しくお教えいた
> > だくことはできますでしょうか。またお使いになっているKH Coderのバージョ
> > ンもお書きください。
> >
> > KH Coderのバージョンはについてはメニューから「ヘルプ」「KH Coderについ
> > て」とたどることで確認できます。
>
> 樋口様、
> ご返信ありがとうございます。PCの環境のせいだったのか、正常に作動致しました。
> ありがとうございました。


  [No.2775] Re: 出現頻度算出におけるデータ行列について 投稿者:HIGUCHI Koichi  投稿日:2016/12/02(Fri) 16:22:00

こんにちは、樋口です。書き込みありがとうございます。

メニューから「ツール」「文書」「『文書×抽出語』表の出力」とたどっていただ
くと、そうしたデータを取り出せるのではないでしょうか。

もし違うものをイメージなさっていた場合はすみません。


  [No.2778] Re: 出現頻度算出におけるデータ行列について 投稿者:   投稿日:2016/12/02(Fri) 23:19:49

樋口様、

ありがとうございます。
助かりました。



> こんにちは、樋口です。書き込みありがとうございます。
>
> メニューから「ツール」「文書」「『文書×抽出語』表の出力」とたどっていただ
> くと、そうしたデータを取り出せるのではないでしょうか。
>
> もし違うものをイメージなさっていた場合はすみません。