Re: 対応分析の対象となる抽出語について (としゆき) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.2856] Re: 対応分析の対象となる抽出語について 投稿者:としゆき  投稿日:2017/01/11(Wed) 22:58:41

樋口様、

大変わかりやすいご説明ありがとうございます。
もし、コンソール画面に表示される成分の固有値と寄与率一覧をEXCELに
落とすためのRのプログラムなどが、この掲示板で議論された
ことはありますでしょうか?もしありましたら、
参考利用したいので教えてください。

また、語のTF−IDF値もCVSに落とすようなRの拡張プログラムが
議論されておりましたら、同様にお願いいたします。

よろしくお願いいたします。



> こんにちは、樋口です。書き込みありがとうございます。
>
> 対応分析では、分析の対象にする語を2つの段階で選択しています。たとえば、
> こちらの設定画面の場合を見てみましょう。
> http://www.slideshare.net/khcoder/kh-coder-28776074/20
>
> (i)設定画面の左側「抽出語の選択」部分で、まず、45回以上出現している
> 79語を分析対象にしています。
>
> (ii)さらに、その79語の中で、差異が顕著な60語だけに絞っています。設定
> 画面右側で、「差異が顕著な語…」のチェックを外せば、この2段階目の選択を
> せずに、79語すべてを分析に使うこともできます。
>
> こうした語の選択について、詳しくはマニュアルのA.5.8節をご覧下さい。
>
>
> 対応分析では以上のように、対象とする語を絞っています。それに対して、
> 「外部変数と見出し」から特徴語を検索する場合は、対象とする語を(i)や
> (ii)のような方法で絞らずに検索します。したがって、たとえば比較的頻度
> が低い語も分析の対象に入ってきます。その結果として、特徴語としてリスト
> アップされても、対応分析には表示されないという語も生じるでしょう。
>
> なお蛇足ながら、上の書き込みでは「対応分析の『外部変数と見出し』の機能
> (後略)」とお書きいただいています。しかし、対応分析の機能と、特徴語上
> 位10語をまとめる機能とは、まったく別々のものですのでご注意ください。利
> 用目的は似ていると思いますが、内部で何をしているかという機能としては別
> 物です。また、特徴語を検索する機能ではJaccard以外の係数も利用可能です。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)