Re: 対応分析の対象となる抽出語について (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.2846] Re: 対応分析の対象となる抽出語について 投稿者:HIGUCHI Koichi  投稿日:2017/01/09(Mon) 04:12:11

こんにちは、樋口です。書き込みありがとうございます。

対応分析では、分析の対象にする語を2つの段階で選択しています。たとえば、
こちらの設定画面の場合を見てみましょう。
http://www.slideshare.net/khcoder/kh-coder-28776074/20

(i)設定画面の左側「抽出語の選択」部分で、まず、45回以上出現している
79語を分析対象にしています。

(ii)さらに、その79語の中で、差異が顕著な60語だけに絞っています。設定
画面右側で、「差異が顕著な語…」のチェックを外せば、この2段階目の選択を
せずに、79語すべてを分析に使うこともできます。

こうした語の選択について、詳しくはマニュアルのA.5.8節をご覧下さい。


対応分析では以上のように、対象とする語を絞っています。それに対して、
「外部変数と見出し」から特徴語を検索する場合は、対象とする語を(i)や
(ii)のような方法で絞らずに検索します。したがって、たとえば比較的頻度
が低い語も分析の対象に入ってきます。その結果として、特徴語としてリスト
アップされても、対応分析には表示されないという語も生じるでしょう。

なお蛇足ながら、上の書き込みでは「対応分析の『外部変数と見出し』の機能
(後略)」とお書きいただいています。しかし、対応分析の機能と、特徴語上
位10語をまとめる機能とは、まったく別々のものですのでご注意ください。利
用目的は似ていると思いますが、内部で何をしているかという機能としては別
物です。また、特徴語を検索する機能ではJaccard以外の係数も利用可能です。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)