こんにちは、樋口です。書き込みありがとうございます。
出現回数の大きい語が、原点の近くに布置されがちだということですね。これ
はよく起こることです。
たとえば「ある」「する」「ない」のような一般的な語は、出現回数が多く、
なおかつデータ中のどの部分にも出現します。よって、こうした一般的な語は、
原点近くの大きなバブルとしてあらわれます。
そういう意味で決しておかしな結果ではないのですが、だからといって、相違
が無いと言えるわけでも無いように思います。出現数の小さい語から特徴が分
かることもあるかもしれません。違いが「ある」か「ない」か確認したいとい
う場合には、コーディングルールを作成してのクロス集計が有効でしょう。重
要ないくつかのコードについて、「朝日」でも「読売」でも出現率が変わら
ないということであれば、相違がないと言えそうに思います。