今回は「仮説検定の考え方」についてです。今回の内容は 『完全独習 統計学入門』という書籍のp90~97の内容をまとめたものです。非常に分かりやすく説明してありましたので、その内容に沿って進めていきます。
引用箇所は全て””にしていますのでご了承ください。
統計的推定とは
まず、統計的推定とは何か、というお話から始まります。
私たちが何かデータを集めようとする時、多くの場合は母集団のすべてのデータを集めることは難しいですよね。ですので、母集団から一部のサンプルを抜き出して調査を行います。
つまり、私たちは日常、膨大なデータセットの中のわずかな数個のデータを観測している、そう理解するところから出発します。
p90
そう理解すると、次に考えたくなるのは、「いくつかのデータを現実に観測したことから、その背後に広がる膨大な全データについて、何かを推測できないか」ということでしょう。
p90
このように「部分から全体を推測する」ということが統計学の醍醐味だといえます。
p90
つまり、統計的推定というのは「一部のサンプルを調査することで母集団について推測する」ということなのですね。
母集団の推測とはどういうことか
次に、サンプルから母集団を推測する手段の代表的なものである「検定」について説明されています。
その例として、以下のような例題が挙げられています。
N枚の正しいコインを投げる実験を行って、表が10枚出た、という結果のみを知っているとしよう。投げた枚数Nとして、次のように想定するのが妥当かどうかを、それぞれについて判断せよ。
p92
①16枚 ②36枚
表が出た枚数が10枚とだけ分かっていて、そこから「コインを何枚投げたか」が推測できるか、ということですよね。少し、抽象的な問いではありますが…
普通に考えると「コインの裏表が出る確率はどちらも1/2の確率なので、10枚表が出たということは20枚を投げたのでは?」と思いますよね。もちろんこれも妥当なのですが、果たして20枚からどれだけ離れても妥当と考えていいのか、というところを推測していくわけです。
ではどうやって推測するか
では、どのようにしてそれを推測するのか、というお話です。
「母数Nとして妥当な数値をどこまで許容するか」を考えるとき、統計学では「95パーセント予言的中区間」の考え方を利用します。
p94
この辺はなかなかイメージがつきにくいと思うのですが、コインを①16枚投げた場合と、②36枚投げた場合で、表が出る枚数に関する確率分布のグラフをイメージします。
「確率分布」という、また聞きなれない用語が出てきましたが、例えばコインを16枚投げた場合に、表が1枚出る確率、表が2枚出る確率、・・・、表が16枚出る確率という風にそれぞれの確率を棒グラフで表していきます。
これは1つ1つ確率を求める必要はなく、コインをN枚投げた場合には表が出る平均回数はN/2枚、標準偏差(S.D.)は√N/2の正規分布になるとされています。
つまりコインを16枚投げた場合には、表が出る平均回数は16/2=8枚、S.D.は√16/2=2の正規分布になります。
正規分布の場合(x – 平均値)/S.D. を計算することで標準正規分布に変換することができます。そして、標準正規分布においては、-1.96~1.96という範囲が全体の95%に当たります。
つまり、コインを16枚投げた場合、表が出る枚数の「95パーセント予言的中区間」は以下のように計算できます。
4.08≦x≦11.92ですので、コインを16枚投げるという作業を100回繰り返した場合、その95回は「表が4.08~11.92枚出る」ということを表します。
例題は「N枚のコインを投げて、表が出たのが10枚であった」という内容でした。N=16の場合に表が10枚出るというのは95パーセント予言的中区間の範囲内になりますので「N=16は妥当である」という解釈をします。
一方、コインを36枚投げた場合はどうでしょうか。同様に考えてみましょう。この場合、表が出る枚数の平均は36/2=18枚、S.D.は√36/2=3の正規分布になると考えられます。そして、(x-平均値)/S.D. が -1.96~1.96に入る範囲を計算することで95パーセント予言的中区間を求めることができます。
つまり、コインを36枚投げるという作業を100回繰り返した時、その95回は「表が12.12~23.88枚出る」となります。
例題は「N枚のコインを投げて、表が出たのが10枚であった」という内容でしたので、N=36と考えると、表が出る枚数の95パーセント予言的中区間は12.12~23.88枚なので、10枚だとその範囲外となります。
このとき、私たちは2つの考え方をすることができます
考え方1
母集団に関する仮説は正しく、覚悟していたリスク(5パーセントの確率でしか起こらない稀な出来事)が起きてしまった。考え方2
p95
母集団に関する仮説が正しくない。
統計学では、考え方2のほうを採用します。
つまり、N=36のときは、95パーセント予言的中区間は12.12~23.88枚であるのに対して「表が10枚であった」場合、その仮説(つまりN=36)は正しくない(棄却する)という判断になるわけですね。
よって、例題における答えは「コインを投げた枚数は、16枚は妥当だが、36枚は妥当ではない」となります。
まとめ
以上、仮説検定の基本的な考え方についてをまとめました。私自身、ようやくこの感じが感覚的には分かってきましたが、まだ言葉で上手く説明できていないですね(汗)
今回はとりあえず「仮説検定とはこういう考え方なんだな」というのが伝われば良いかと思いました。もう少し分かりやすく説明できるよう、しっかり内容をかみ砕いていこうと思います!
《参考書籍》
・完全独習 統計学入門.小島寛之.ダイヤモンド社.2006年.
コメント