こんにちは、樋口です。書き込みありがとうございます。
すみません、Twitterのスクリーンショットは開発中のもので、この表示は
「Correlation」に固定となりました。
説明も今のところTwitterでの簡単なもののみですね。
https://twitter.com/khcoder/status/887563080225275904
https://twitter.com/khcoder/status/870657651536838656
「出現位置」を選択した場合、(1)各文書に1から始まって2、3と順に大きく
なる「文書番号」を振っています。一方で、(2)語があったかどうか、共起
があったかどうかを示す0-1の2値変数があります。この2つの相関係数をもと
に色を決めています。
したがって、語や共起がデータの前の方に偏っていた場合、(1)文書番号は
相対的に小さくなり、相関係数は小さく(マイナスに)なり、色は青っぽく
なります。
もし「出現位置」ではなく、アンケート自由回答の場合に回答者の「年収」を
選択したら、収入の低い人に多い語や共起ほど、青い色で表示されるでしょう。
ただし「年収」が外部変数として入力されている必要があります。