こんにちは。管理人のハル(@haru_reha)です。今回はαエラー、βエラー、検出力(パワー)の意味について書いておこうと思います。このテーマを取り上げたのは、サンプルサイズを計算する際に、これらの用語を理解しておく必要があるからです。次回くらいにEZRでサンプルサイズを計算する方法をUPしようと思いますので、その前に用語をざっと確認しておきましょう。
αエラー(1型エラー)とは?
初めにαエラーについてです。αエラーは「1型エラー(または第1種過誤)」とも呼ばれます。
αエラーとは
本当は差がないのに、差があるという間違い
のことです(偽陽性)。
つまりαエラーを起こす可能性が5%だとすると「100回に5回は本当は差がないのに有意差ありとなる可能性がある」という解釈になります。
統計解析の結果はP値で判断されることが多いですが、P値の定義は次の通りでした。
帰無仮説が正しい場合に、実際に観測された、あるいはそれ以上の2群の差が観察される確率
つまり「P値=αエラーを起こす確率」という捉え方もできますね。P値についてもう少し詳しく知りたい方は↓の記事をどうぞ。
そしてP値がいくら未満であれば有意と言えるのかを定めるのが「有意水準」でした。多くの研究では有意水準は5%(または1%)とされていますよね。つまりαエラーを起こす可能性が5%(または1%)未満であれば「有意差あり」とみなすと設定しているわけですね。
αエラーは「あ(a)わてんぼさんの過ち(本当は差がないのに慌てて差があると判断してしまう)」と考えると覚えやすいです。
βエラー(2型エラー)とは?
つぎにβエラーについてです。βエラーは「2型エラー(または第2種過誤)」とも呼ばれます。
βエラーは
本当は差があるのに、差がないという間違い
のことです(偽陰性)。
つまりβエラーを起こす可能性が20%の場合は「100回に20回は本当は差があるのに、有意差なしとなる可能性がある」という解釈ですね。
次回で詳しくやりますが、サンプルサイズを計算する際にβエラーは「20%以下」に設定するのが慣例のようです。αエラーの水準(5%)と比べて高めの設定になるので、論文を読む際に「有意差なし」という結果が出てきた時は、βエラーの存在も意識しておくとよいかもしれません。
「有意差なし」だからといって「差がなかった」と言い切れるわけではなく、サンプル数が不足していただけかもしれませんし、βエラーが生じていた可能性もあるわけです。「有意差なし」の解釈には注意が必要です。
βエラーは「ぼ(b)んやりさんの過ち(本当は差があるのにぼんやりして見過ごしてしまう)」と考えると覚えやすいです。
検出力(パワー)とは?
最後に検出力についてです。検出力は「パワー」とも呼ばれます。
検出力は
で計算されます。
例えばβエラーを起こす可能性が20%の時は「100%-20%=80%」ですので、検出力は80%ということになります。
検出力は
本当に差があるときに差があるという確率
を表します(感度)。
サンプルサイズを計算する時には、検出力を80%以上に設定するのが慣例のようです。
まとめ
以上、αエラー、βエラー、検出力について簡単に説明しました。αとβがごっちゃになって分かりにくいですが、個人的に「あわてんぼさんの過ち」と「ぼんやりさんの過ち」という語句で覚えれば間違えにくいと思っております。
次回は、実際にEZRで必要サンプルサイズを計算する方法をご紹介します。研究計画の段階で必要サンプルサイズを計算しておくことは、すごく大切なことだと思うのです。そうしないと、統計学的な有意差が意味のある差なのか分からなくなります。
【追記】サンプルサイズの計算については⇩の記事に書きました。
では、また。
コメント