樋口先生KH Corderを初めて使わせていただいております。初歩的なことで大変お恥ずかしいのですが、出現回数:分布記述統計異なり語数 :4520出現回数の平均 :8.73出現回数の標準偏差 :45.26という結果がでましたが、「出現回数の標準偏差」とはどのような意味でしょうか。この数値の持つ意味はなんでしょうか。よろしくお願いいたします。
こんにちは、樋口です。書き込みありがとうございます。平均して8.73回出現していたのですが、全4520語について見ると、どれくらい平均(8.73)から離れていたかという数値です。それぞれの語の出現回数が平均からどれくらい離れていたかというのは、言葉をかえると、どれくらいバラツキがあったか、どれくらい散らばっていたかという数値です。もし平均が5で標準偏差が0なら、バラツキが0ということですから、すべての語の出現回数が5だったということになります。詳しくは統計の本で、標準偏差の説明をお読みいただくのが確実です。https://amzn.to/2rsulfp
樋口先生早速の返信ありがとうございます。今回のデータから考えると、平均は8.73でこの数値からのバラツキが45.26ということですね。この45.26という数値が高いほど信頼性が高い(またはある数値以下なら信頼性が高い)など、今回の分析結果に直接かかわるような数値ではないでしょうか。標準偏差と聞くと±2SDなどを思い出しますが、この45.26との関連がよくわかりませんでした。統計がよくわからないので、再度ご紹介いただいた本で勉強したいと思います。
こんにちは、樋口です。書き込みありがとうございます。出現回数の分布の様子が分かるように表示している数値です。信頼性とは直接関係しないと思います。
樋口先生返信ありがとうございます。出現回数の標準偏差についてご教示いただきありがとうございました。もう一つご質問があるのですが、タイトルを変えて再度投稿させていただきます。よろしくお願いいたします。