[掲示板へもどる]
一括表示

  [No.3057] 抽出語×外部変数の、度数集計表(クロス表)の出力 投稿者:  投稿日:2017/07/23(Sun) 17:21:32

樋口先生、

お世話になります、悠と申します。

抽出語×外部変数の、度数集計表(クロス表)を出力したいと思い、
メニューを探しています。

このニーズにあうメニューはあるのでしょうか?

もしない場合には、
文書−抽出語の表をcsvファイル出力して、外部変数の列と、
度数集計表(クロス表)をすることになるのでしょうか?

ご教示いただけましたら大変に助かります。
失礼いたします。


  [No.3058] Re: 抽出語×外部変数の、度数集計表(クロス表)の出力 投稿者:HIGUCHI Koichi  投稿日:2017/07/24(Mon) 07:33:35

こんにちは、樋口です。書き込みありがとうございます。

現在のところ、この機能は備えていません。

現在のKH Coderで「抽出語×外部変数」表を作成するには、以下の手順が比較
的容易かと思います。

[1] メニューから「ツール」「抽出語」「対応分析」とたどり、
[2] 画面右側で「抽出語×外部変数」を選び、利用したい外部変数をクリックし、
[3] 「OK」ボタンで対応分析を実行。
[4] 結果をR Source形式で保存してから、KH Coderに付属のRで実行。
[5] Rに対応分析の結果が表示されてからR Console画面で以下のコマンドを実行。
> write.csv(d,file="c:/khcoder3/data.csv")

これで、C:\khcoder3フォルダにdata.csvという名前で「抽出語×外部変数」表が
保存されます。

なお[4]の詳しい手順についてはこのスライドの1枚目から5枚目までを参照してく
ださい。
https://www.slideshare.net/khcoder/r1kh-coder


  [No.3059] 【御礼】 Re: 抽出語×外部変数の、度数集計表(クロス表)の出力 投稿者:  投稿日:2017/07/24(Mon) 08:29:44

樋口先生、

お忙しいところを失礼いたします、悠と申します。

ご丁寧なご教示をありがとうございました。
//


  [No.3061] Re: 抽出語×外部変数の、度数集計表(クロス表)の出力 投稿者:  投稿日:2017/07/24(Mon) 21:44:59

樋口先生、

お忙しいところを失礼いたします、悠と申します。

ご教示いただきました操作に沿って、
保存したRファイルを、KHcoder梱包のRguiに取り込むと、
以下のエラーメッセージが表示されます。

マップは再現されているようです。

ワーニングメッセージが表示されても、実害はないということでしょうか?


私の環境は、Windows7+KH Coder安定版(Ver. 2.00f, 2015 12/29)です。

データファイルを変えても、再現性があります


ご教示いただけましたら、大変に助かります。


> source("C:\\khcoder\\test.r")
成分 固有値 寄与率
[1,] 1 0.1632 51.94
[2,] 2 0.0799 25.42
[3,] 3 0.0306 9.75
[4,] 4 0.0129 4.11
[5,] 5 0.0115 3.67
[6,] 6 0.0078 2.49
[7,] 7 0.0052 1.67
[8,] 8 0.0030 0.95
[9,] 9 0.0000 0.00
[1] "computing label positions..."
要求されたパッケージ sp をロード中です
Checking rgeos availability: FALSE
Note: when rgeos is not available, polygon geometry computations in maptools depend on gpclib,
which has a restricted licence. It is disabled by default;
to enable gpclib, type gpclibPermit()
要求されたパッケージ Rcpp をロード中です
要求されたパッケージ RColorBrewer をロード中です
Non-function objects are not currently inserted (not traceable): .packageName
Modified functions inserted through trace(): wordlayout
[1] "iterations: 500026"
50 件以上の警告がありました (最初の 50 個の警告を見るには warnings() を使って下さい)
> warnings()
警告メッセージ:
1: In chisq.test(cbind(d[, i], n_total - d[, i])) :
Chi-squared approximation may be incorrect
2: In chisq.test(cbind(d[, i], n_total - d[, i])) :
Chi-squared approximation may be incorrect
3: In chisq.test(cbind(d[, i], n_total - d[, i])) :
Chi-squared approximation may be incorrect
(以下、省略)
//悠


  [No.3062] Re: 抽出語×外部変数の、度数集計表(クロス表)の出力 投稿者:HIGUCHI Koichi  投稿日:2017/07/24(Mon) 23:16:10

こんにちは、樋口です。書き込みありがとうございます。

それらの警告ですが、対応分析に含める語を選択するために、カイ二乗値を計
算する時に出ている警告です。「もし検定をするなら、カイ二乗分布で近似で
きるかどうか怪しいよ」という警告かと思います。

これらは無視して差し支えありません。

もし気になるようでしたら、対応分析を実行する際に「差異が顕著な語を分析
に使用」のチェックを外しておけば、カイ二乗値の計算が行なわれず、この警
告も出ないはずです。


  [No.3063] Re: 抽出語×外部変数の、度数集計表(クロス表)の出力 投稿者:  投稿日:2017/07/25(Tue) 08:26:19

樋口先生、

お忙しいところを失礼いたします、悠と申します。
ご教示をいただきまして、誠にありがとうございました。

今回の質問で気が付いたのですが(推奨できない方法かもしれませんが)、

KHcoderに取り込んで作成したデータでなくても、
抽出語*外部変数の度数分割表のデータファイルを用意すれば、
そのファイルを読み込むことで、
このRプログラムを再利用させていただき、
きれいな対応分析のマップを作成することができるような気がしましたので、
トライしてみたいと思います。