平均値±SD(標準偏差)が表す意味

統計学の基礎知識

こんにちは。管理人のハル(@haru_reha)です。

今回は平均値±SD(標準偏差)が表す意味について説明します。

スポンサーリンク
☆Udemyでのコース公開☆

シロート統計学講座をUdemyで公開しています。3時間の動画で、統計学の基礎からEZRでの解析実施を一気に学べます。統計解析の初心者の方でも、基本的な統計解析が実践できるレベルを目指すことができます。>>>Udemy「シロート統計学講座」

〇±□とは?

さて、学会や論文でよく平均30.0±5.0という記載をみることがありますよね。これは平均値±SD(標準偏差)ですが、これが表す意味って案外分かりにくいのではないかと思います。

例えば平均年齢が70.0±10.0才である場合、どんなことを意味するでしょうか?

時々、±10.0の意味を間違えて「対象者の年齢は60才から80才だったんだな」と解釈する方がおられますが、それは間違いなので要注意です!

平均値±SD(標準偏差)が表す意味

そもそもSD(標準偏差)とは standard deviation の略で、簡単に言うとデータのバラツキを示す指標になります。ですが、70.0±10.0 は「60(70−10)~80(70+10)」を意味するわけではありません。

平均値を代表値としてデータを表す場合、基本的にはデータが正規分布に従うことが前提となります。*平均値について知りたい方はこちら → 平均値と中央値

正規分布とは、データが下のような鐘型の分布になることです。

正規分布するデータでは、平均値の分布が最も多く、山の頂上になります。つまり横軸の0は平均値を表しています。

また、 σ(シグマ)はSD(標準偏差)のことで、図をよく見てみると0~1σの所に34.1%と書いてありますよね。これはデータが正規分布の場合「0~1σの間に全体の34.1%が存在する」ということを表しています。

また反対に、-1σ~0の間も34.1%となっているので「-1σ~0の間に全体の34.1%が存在する」となります。0は平均値、σはSDのことでしたので「平均値から1SDを引いた値から、平均値に1SDを足した値までの間に約70%が存在する」ということになります。

つまり70.0±10.0才の場合「60才~80才までの間にデータの約70%の人が存在する」ということを表すわけですね。同様に、-2σ~2σは約95%となっているので「50才~90才までの間にデータの約95%の人が存在する」ことを表します。

まとめ

まとめると

(平均値-1SD)~(平均値+1SD)の間に約70%
(平均値-2SD)~(平均値+2SD)の間に約95%
の人が存在する

ことになります。

つまり70.0±10.0才とは「平均値は70才で、60才~80才の間に約70%の人がおり、50才~90才までの間に約95%の人がいるデータですよ」ということを表します。

決して「データの全員が60才~80才の人であった」ということではないので注意が必要ですね。

本記事をお読み頂きありがとうございました。当ブログではシロート統計学講座という初心者向けの統計学講座を公開しています。初心者が基本的な統計解析を行えるようになるまでの道筋を分かりやすく説明していますので、興味のある方はぜひ覗いてみてくださいね。

▼シロート統計学講座はこちらから▼

シロート統計学講座
統計学の基礎から無料統計ソフトEZRの使い方までを一挙に学ぶことができる超初心者用の統計学講座です。

▼管理人(ハル)のおすすめ参考書籍はこちら▼

統計学や無料統計ソフトEZRの使い方、臨床研究に関するおすすめ書籍
統計学や無料統計ソフトEZRの使い方に関するおすすめ書籍を紹介しています。

コメント

タイトルとURLをコピーしました