平均値±SD(標準偏差)が表す意味

研究雑学

こんにちは。管理人のハル(@haru_reha)です。

今回は平均値±SD(標準偏差)が表す意味について説明します。

スポンサーリンク

〇±□とは?

さて、学会や論文でよく平均30.0±5.0という記載をみることがありますよね。これは平均値±SD(標準偏差)ですが、これが表す意味って案外分かりにくいのではないかと思います。

例えば平均年齢が70.0±10.0才である場合、どんなことを意味するでしょうか?

時々、±10.0の意味を間違えて「対象者の年齢は60才から80才だったんだな」と解釈する方がおられますが、それは間違いなので要注意です!

平均値±SD(標準偏差)が表す意味

そもそもSD(標準偏差)とは standard deviation の略で、簡単に言うとデータのバラツキを示す指標になります。ですが、70.0±10.0 は「60(70−10)~80(70+10)」を意味するわけではありません。

平均値を代表値としてデータを表す場合、基本的にはデータが正規分布に従うことが前提となります。*平均値について知りたい方はこちら → 平均値と中央値

正規分布とは、データが下のような鐘型の分布になることです。

正規分布するデータでは、平均値の分布が最も多く、山の頂上になります。つまり横軸の0は平均値を表しています。

また、 σ(シグマ)はSD(標準偏差)のことで、図をよく見てみると0~1σの所に34.1%と書いてありますよね。これはデータが正規分布の場合「0~1σの間に全体の34.1%が存在する」ということを表しています。

また反対に、-1σ~0の間も34.1%となっているので「-1σ~0の間に全体の34.1%が存在する」となります。0は平均値、σはSDのことでしたので「平均値から1SDを引いた値から、平均値に1SDを足した値までの間に約70%が存在する」ということになります。

つまり70.0±10.0才の場合「60才~80才までの間にデータの約70%の人が存在する」ということを表すわけですね。同様に、-2σ~2σは約95%となっているので「50才~90才までの間にデータの約95%の人が存在する」ことを表します。

まとめ

まとめると

(平均値-1SD)~(平均値+1SD)の間に約70%
(平均値-2SD)~(平均値+2SD)の間に約95%
の人が存在する

ことになります。

つまり70.0±10.0才とは「平均値は70才で、60才~80才の間に約70%の人がおり、50才~90才までの間に約95%の人がいるデータですよ」ということを表します。

決して「データの全員が60才~80才の人であった」ということではないので注意が必要ですね。

本記事をお読み頂きありがとうございました。当ブログではシロート統計学講座という初心者向けの統計学講座を公開しています。初心者が基本的な統計解析を行えるようになるまでの道筋を分かりやすく説明していますので、興味のある方はぜひ覗いてみてくださいね。

▼シロート統計学講座はこちらから▼

シロート統計学講座
シロート統計学講座へようこそ!統計学初心者を基本的な統計解析が実践できるレベルまで導きます。

▼管理人(ハル)のおすすめ参考書籍はこちら▼

おすすめ参考書籍
シロート統計学講座を作成するに当たって参考にしている書籍をご紹介します。私も全くのシロートの状態から、これらの書籍をじっくり読んで少しずつ統計学が分かってきました。興味のある方はぜひ読んでみてください。 ①初心者でもすぐにでき...

コメント