αエラー、βエラー、検出力（パワー）の意味を理解する

統計学の基礎知識

2019.02.162021.01.13

こんにちは。管理人のハル（@haru_reha）です。今回はαエラー、βエラー、検出力（パワー）の意味について書いておこうと思います。このテーマを取り上げたのは、サンプルサイズを計算する際に、これらの用語を理解しておく必要があるからです。次回くらいにEZRでサンプルサイズを計算する方法をUPしようと思いますので、その前に用語をざっと確認しておきましょう。

スポンサーリンク

目次

αエラー（1型エラー）とは？
βエラー（2型エラー）とは？
検出力（パワー）とは？
まとめ

αエラー（1型エラー）とは？

初めにαエラーについてです。αエラーは「1型エラー（または第1種過誤）」とも呼ばれます。

αエラーとは

本当は差がないのに、差があるという間違い

引用：みんなの医療統計 12日間で基礎理論とEZRを完全マスター！（p227-228）

のことです（偽陽性）。

つまりαエラーを起こす可能性が5%だとすると「100回に5回は本当は差がないのに有意差ありとなる可能性がある」という解釈になります。

統計解析の結果はP値で判断されることが多いですが、P値の定義は次の通りでした。

帰無仮説が正しい場合に、実際に観測された、あるいはそれ以上の2群の差が観察される確率

引用：フリー統計ソフトEZRで誰でも簡単統計解析（p8）

つまり「P値＝αエラーを起こす確率」という捉え方もできますね。P値についてもう少し詳しく知りたい方は↓の記事をどうぞ。

P値の意味を改めて理解する

シロート統計学講座「其の１２」

そしてP値がいくら未満であれば有意と言えるのかを定めるのが「有意水準」でした。多くの研究では有意水準は5%（または1%）とされていますよね。つまりαエラーを起こす可能性が5%（または1%）未満であれば「有意差あり」とみなすと設定しているわけですね。

αエラーは「あ(a)わてんぼさんの過ち（本当は差がないのに慌てて差があると判断してしまう）」と考えると覚えやすいです。

βエラー（2型エラー）とは？

つぎにβエラーについてです。βエラーは「2型エラー（または第2種過誤）」とも呼ばれます。

βエラーは

本当は差があるのに、差がないという間違い

引用：みんなの医療統計 12日間で基礎理論とEZRを完全マスター！（p227-228）

のことです（偽陰性）。

つまりβエラーを起こす可能性が20%の場合は「100回に20回は本当は差があるのに、有意差なしとなる可能性がある」という解釈ですね。

次回で詳しくやりますが、サンプルサイズを計算する際にβエラーは「20%以下」に設定するのが慣例のようです。αエラーの水準（5%）と比べて高めの設定になるので、論文を読む際に「有意差なし」という結果が出てきた時は、βエラーの存在も意識しておくとよいかもしれません。

「有意差なし」だからといって「差がなかった」と言い切れるわけではなく、サンプル数が不足していただけかもしれませんし、βエラーが生じていた可能性もあるわけです。「有意差なし」の解釈には注意が必要です。

βエラーは「ぼ(b)んやりさんの過ち（本当は差があるのにぼんやりして見過ごしてしまう）」と考えると覚えやすいです。

検出力（パワー）とは？

最後に検出力についてです。検出力は「パワー」とも呼ばれます。

検出力は

100% – βエラーの確率

で計算されます。

例えばβエラーを起こす可能性が20%の時は「100%-20%=80%」ですので、検出力は80%ということになります。

検出力は

本当に差があるときに差があるという確率

引用：みんなの医療統計 12日間で基礎理論とEZRを完全マスター！（p228)

を表します（感度）。

サンプルサイズを計算する時には、検出力を80%以上に設定するのが慣例のようです。

まとめ

以上、αエラー、βエラー、検出力について簡単に説明しました。αとβがごっちゃになって分かりにくいですが、個人的に「あわてんぼさんの過ち」と「ぼんやりさんの過ち」という語句で覚えれば間違えにくいと思っております。

＊この覚え方は下記のサイトで紹介されているものを引用させて頂きました。

αエラーとβエラー - 大人になってからの再学習

キーワード：αエラー、βエラー、偽陽性、偽陰性、第一種の過誤、第二種の過誤、ベイズ推定例として、肝臓癌の検査を取り上げてみる。検査結果が100％正しいことはなく、結果には誤りが含まれる。検査の誤りには次の2通りがある。(A) 「肝臓癌では...

次回は、実際にEZRで必要サンプルサイズを計算する方法をご紹介します。研究計画の段階で必要サンプルサイズを計算しておくことは、すごく大切なことだと思うのです。そうしないと、統計学的な有意差が意味のある差なのか分からなくなります。

【追記】サンプルサイズの計算については⇩の記事に書きました。

必要サンプルサイズを計算する理由

管理人のハル（＠haru_reha）です。今回は、必要サンプルサイズを計算する理由について説明しておきます。サンプルサイズとP値の関係サンプルサイズとは「標本の大きさ」のことです。基本的に、統計学ではサンプルサイズが大きいほど正確なデータが...

EZRで必要サンプルサイズを計算する方法【2群で平均値を比較する場合】

どうも。管理人のハル（@haru_reha）です。今回はEZRを使って必要サンプルサイズを計算する方法をご紹介します。今回は一番使用する頻度が多そうな2群で平均値を比較する場合についてです。計算に当たっては「αエラー」「βエラー」「検出力」...

EZRで必要サンプルサイズを計算する方法②【2群で比率を比較する場合】

どうも。管理人のハル（@haru_reha）です。今回は、EZRを使って2群で比率を比較する場合の必要サンプルサイズを計算してみます。今回もαエラー、βエラー、検出力などの単語が出てきますので、そちらの理解がまだの方は先にこちら↓を読んでく...

では、また。

コメント

タイトルとURLをコピーしました