先生、おはようございます。
早々のお返事ありがとうございました。
1.以下の記事は公開時に拝見しておりました。承知しております。
ありがとうございました。
-------------------
説明も今のところTwitterでの簡単なもののみですね。
https://twitter.com/khcoder/status/887563080225275904
https://twitter.com/khcoder/status/870657651536838656
-------------------
2.相関係数のカラー化についての先生の記述に、とても興味を持ちました。
============================
>「出現位置」を選択した場合、(1)各文書に1から始まって2、3と順に大きく
なる「文書番号」を振っています。一方で、(2)語があったかどうか、共起
があったかどうかを示す0-1の2値変数があります。この2つの相関係数をもと
に色を決めています。
============================
…ということは、収集された自由回答のテキストデータ群が時系列で収集された
情報である場合は、以下の<前提>のもとで<相関係数のカラー化>が行われると
理解してよろしいでしょうか。
<前提>
(1)用意するテキストデータ群は、情報を解析・評価する際の着目ポイントに
ついて「外部変数」(エクセルの列項目)として用意する。
(2)着目ポイントに相当する外部変数と「値」は、評価の高低や時間の経過(
例えば、“こころ”であれば「上中下」)をカテゴリー化して用意する。
<相関係数のカラー化>
上記の前提のもとで、先生の文章について、小職が現状のスキルで理解する言
葉で整理しました。以下でよろしいでしょうか。
(1)「出現位置」を選択した場合
・選択した“プロジェクト”に共起する“語”のネットワークについて、
・時系列の全データに共起する語を抽出して、
・“良く出現する抽出語(データ群に特徴的な語)とその語とネットワークする
語”およびそれらの組み合わせについて相関係数を評価し、相関をカラー化する。
(2)着目する「外部変数」を選択した場合
・「外部変数」の“値”を持つデータ列を対象に共起する語を抽出して、
・“良く出現する抽出語(データ群に特徴的な語)とその語とネットワークする語”
およびそれらの組み合わせについて相関係数を評価し、相関をカラー化する。
3.小職がトライアル中の事例は、一定期間を経過した後に解析結果を論文形式で
病院長へ報告する予定です。
・外部変数と共起する“語”についての相関は、どの情報を参照すればよろしい
でしょうか。
※過去のスレッドだと、「[No.3057]抽出語×外部変数の度数集計表の出力」の
方法が該当するでしょうか。