αエラー、βエラー、検出力(パワー)の意味を理解する

統計学の基礎知識

こんにちは。管理人のハル(@haru_reha)です。今回はαエラー、βエラー、検出力(パワー)の意味について書いておこうと思います。このテーマを取り上げたのは、サンプルサイズを計算する際に、これらの用語を理解しておく必要があるからです。次回くらいにEZRでサンプルサイズを計算する方法をUPしようと思いますので、その前に用語をざっと確認しておきましょう。

スポンサーリンク
☆Udemyでのコース公開☆

シロート統計学講座をUdemyで公開しています。3時間の動画で、統計学の基礎からEZRでの解析実施を一気に学べます。統計解析の初心者の方でも、基本的な統計解析が実践できるレベルを目指すことができます。>>>Udemy「シロート統計学講座」

αエラー(1型エラー)とは?

初めにαエラーについてです。αエラーは「1型エラー(または第1種過誤)」とも呼ばれます。

αエラーとは

本当は差がないのに、差があるという間違い

引用:みんなの医療統計 12日間で基礎理論とEZRを完全マスター!(p227-228)

のことです(偽陽性)。

つまりαエラーを起こす可能性が5%だとすると「100回に5回は本当は差がないのに有意差ありとなる可能性がある」という解釈になります。

統計解析の結果はP値で判断されることが多いですが、P値の定義は次の通りでした。

帰無仮説が正しい場合に、実際に観測された、あるいはそれ以上の2群の差が観察される確率

引用:フリー統計ソフトEZRで誰でも簡単統計解析(p8)

つまり「P値=αエラーを起こす確率」という捉え方もできますね。P値についてもう少し詳しく知りたい方は↓の記事をどうぞ。

P値の意味を改めて理解する
シロート統計学講座「其の12」

そしてP値がいくら未満であれば有意と言えるのかを定めるのが「有意水準」でした。多くの研究では有意水準は5%(または1%)とされていますよね。つまりαエラーを起こす可能性が5%(または1%)未満であれば「有意差あり」とみなすと設定しているわけですね。

αエラーは「あ(a)わてんぼさんの過ち(本当は差がないのに慌てて差があると判断してしまう)」と考えると覚えやすいです。

βエラー(2型エラー)とは?

つぎにβエラーについてです。βエラーは「2型エラー(または第2種過誤)」とも呼ばれます。

βエラーは

本当は差があるのに、差がないという間違い

引用:みんなの医療統計 12日間で基礎理論とEZRを完全マスター!(p227-228)

のことです(偽陰性)。

つまりβエラーを起こす可能性が20%の場合は「100回に20回は本当は差があるのに、有意差なしとなる可能性がある」という解釈ですね。

次回で詳しくやりますが、サンプルサイズを計算する際にβエラーは「20%以下」に設定するのが慣例のようです。αエラーの水準(5%)と比べて高めの設定になるので、論文を読む際に「有意差なし」という結果が出てきた時は、βエラーの存在も意識しておくとよいかもしれません。

「有意差なし」だからといって「差がなかった」と言い切れるわけではなく、サンプル数が不足していただけかもしれませんし、βエラーが生じていた可能性もあるわけです。「有意差なし」の解釈には注意が必要です。

βエラーは「ぼ(b)んやりさんの過ち(本当は差があるのにぼんやりして見過ごしてしまう)」と考えると覚えやすいです。

検出力(パワー)とは?

最後に検出力についてです。検出力は「パワー」とも呼ばれます。

検出力は

100% – βエラーの確率

で計算されます。

例えばβエラーを起こす可能性が20%の時は「100%-20%=80%」ですので、検出力は80%ということになります。

検出力は

本当に差があるときに差があるという確率

引用:みんなの医療統計 12日間で基礎理論とEZRを完全マスター!(p228)

を表します(感度)。

サンプルサイズを計算する時には、検出力を80%以上に設定するのが慣例のようです。

まとめ

以上、αエラー、βエラー、検出力について簡単に説明しました。αとβがごっちゃになって分かりにくいですが、個人的に「あわてんぼさんの過ち」と「ぼんやりさんの過ち」という語句で覚えれば間違えにくいと思っております。

次回は、実際にEZRで必要サンプルサイズを計算する方法をご紹介します。研究計画の段階で必要サンプルサイズを計算しておくことは、すごく大切なことだと思うのです。そうしないと、統計学的な有意差が意味のある差なのか分からなくなります。

【追記】サンプルサイズの計算については⇩の記事に書きました。

必要サンプルサイズを計算する理由
管理人のハル(@haru_reha)です。今回は、必要サンプルサイズを計算する理由について説明しておきます。 サンプルサイズとP値の関係 サンプルサイズとは「標本の大きさ」のことです。 基本的に、統計学ではサンプルサイズが大きいほど正確なデ...
EZRで必要サンプルサイズを計算する方法【2群で平均値を比較する場合】
どうも。管理人のハル(@haru_reha)です。今回はEZRを使って必要サンプルサイズを計算する方法をご紹介します。今回は一番使用する頻度が多そうな2群で平均値を比較する場合についてです。計算に当たっては「αエラー」「βエラー」「検出力」...
EZRで必要サンプルサイズを計算する方法②【2群で比率を比較する場合】
どうも。管理人のハル(@haru_reha)です。今回は、EZRを使って2群で比率を比較する場合の必要サンプルサイズを計算してみます。今回もαエラー、βエラー、検出力などの単語が出てきますので、そちらの理解がまだの方は先にこちら↓を読んでく...

では、また。

コメント

タイトルとURLをコピーしました