αエラー、βエラー、検出力(パワー)の意味を理解する

研究雑学

こんにちは。管理人のハル(@haru_reha)です。今回はαエラー、βエラー、検出力(パワー)の意味について書いておこうと思います。このテーマを取り上げたのは、サンプルサイズを計算する際に、これらの用語を理解しておく必要があるからです。次回くらいにEZRでサンプルサイズを計算する方法をUPしようと思いますので、その前に用語をざっと確認しておきましょう。

スポンサーリンク

αエラー(1型エラー)とは?

初めにαエラーについてです。αエラーは「1型エラー(または第1種過誤)」とも呼ばれます。

 

αエラーとは

本当は差がないのに、差があるという間違い

引用:みんなの医療統計 12日間で基礎理論とEZRを完全マスター!(p227-228)

のことです(偽陽性)。

 

つまりαエラーを起こす可能性が5%だとすると「100回に5回は本当は差がないのに有意差ありとなる可能性がある」という解釈になります。

 

統計解析の結果はP値で判断されることが多いですが、P値の定義は次の通りでした。

帰無仮説が正しい場合に、実際に観測された、あるいはそれ以上の2群の差が観察される確率

引用:フリー統計ソフトEZRで誰でも簡単統計解析(p8)

つまり「P値=αエラーを起こす確率」という捉え方もできますね。P値についてもう少し詳しく知りたい方は↓の記事をどうぞ。

P値の意味を改めて理解する
シロート統計学講座「其の12」

そしてP値がいくら未満であれば有意と言えるのかを定めるのが「有意水準」でした。多くの研究では有意水準は5%(または1%)とされていますよね。つまりαエラーを起こす可能性が5%(または1%)未満であれば「有意差あり」とみなすと設定しているわけですね。

αエラーは「あ(a)わてんぼさんの過ち(本当は差がないのに慌てて差があると判断してしまう)」と考えると覚えやすいです。

βエラー(2型エラー)とは?

つぎにβエラーについてです。βエラーは「2型エラー(または第2種過誤)」とも呼ばれます。

 

βエラーは

本当は差があるのに、差がないという間違い

引用:みんなの医療統計 12日間で基礎理論とEZRを完全マスター!(p227-228)

のことです(偽陰性)。

 

つまりβエラーを起こす可能性が20%の場合は「100回に20回は本当は差があるのに、有意差なしとなる可能性がある」という解釈ですね。

 

次回で詳しくやりますが、サンプルサイズを計算する際にβエラーは「20%以下」に設定するのが慣例のようです。αエラーの水準(5%)と比べて高めの設定になるので、論文を読む際に「有意差なし」という結果が出てきた時は、βエラーの存在も意識しておくとよいかもしれません。

「有意差なし」だからといって「差がなかった」と言い切れるわけではなく、サンプル数が不足していただけかもしれませんし、βエラーが生じていた可能性もあるわけです。「有意差なし」の解釈には注意が必要です。

βエラーは「ぼ(b)んやりさんの過ち(本当は差があるのにぼんやりして見過ごしてしまう)」と考えると覚えやすいです。

検出力(パワー)とは?

最後に検出力についてです。検出力は「パワー」とも呼ばれます。

 

検出力は

100% – βエラーの確率

で計算されます。

 

例えばβエラーを起こす可能性が20%の時は「100%-20%=80%」ですので、検出力は80%ということになります。

 

検出力は

本当に差があるときに差があるという確率

引用:みんなの医療統計 12日間で基礎理論とEZRを完全マスター!(p228)

を表します(感度)。

 

サンプルサイズを計算する時には、検出力を80%以上に設定するのが慣例のようです。

まとめ

以上、αエラー、βエラー、検出力について簡単に説明しました。αとβがごっちゃになって分かりにくいですが、個人的に「あわてんぼさんの過ち」と「ぼんやりさんの過ち」という語句で覚えれば間違えにくいと思っております。

次回は、実際にEZRで必要サンプルサイズを計算する方法をご紹介します。研究計画の段階で必要サンプルサイズを計算しておくことは、すごく大切なことだと思うのです。そうしないと、統計学的な有意差が意味のある差なのか分からなくなります。

では、また。

コメント