t検定の理論を分かりやすく解説【第9回】
前回は対応のあるt検定の理論について説明しましたが、今回は対応のないt検定の理論についてのお話です。
対応のないt検定は、独立した2群間において平均値を比較するものですが、次の①②でt値の求め方が異なります。
今回はいわゆる一般的なt検定である①(studentのt検定)について説明します。
対応のないt検定ではt値の計算が少し複雑になりますが、基本的な考え方はこれまでに学んできた内容と変わりありませんので、落ち着いて学んでいきましょう。
想定する場面
次のような場面を想定します。
A群(n=5)とB群(n=5)で下腿最大周径を測定した。
A群は平均37㎝、分散9であった。
B群は平均30㎝、分散4であった。
このとき、A群とB群の平均値には統計学的有意差があるかを検証したい。
なお、この2群の母集団は等分散であるとみなす。
この場合、A群・B群とも母平均と母分散の具体的な数値は分からない状態です。
分かっているのはA群・B群の標本平均、標本分散のみです。
独立した2群の差におけるt値
前回までの復習になりますが、t値の計算式は以下の通りでした。
分母は標本平均の標準偏差です。
標準偏差は分散にルートをつけた値ですので、以下のように言い換えることができます。
対応のないt検定の場合、独立した2群の差を検定しますので、以下のように考えます。
分母の “2群間の差の分散” は以下のような計算式となります(なぜこの計算になるかという話は割愛します)。
ここでの「s²」はプールした分散と呼ばれ、「A群とB群の分散をまとめたもの」というイメージです。
プールした分散の計算方法は後述しますが、一旦t値の話を進めます!
対応のないt検定における帰無仮説は「2群間の平均値に差はない」というものです。
これは「2群間の母平均の差は0」と仮説することになります。
つまり、以下のように考えます。
よって、対応のないt検定における最終的なt値の計算式は次の通りです。
このtは自由度(n₁+n₂-2)のt分布に従います。
プールした分散の計算
さて、t値の計算式に出てきた「s²」は「プールした分散」と呼ばれます。
プールした分散の計算方法は次のようになります(ここも、なぜこの計算になるのかは割愛します)。
今回で言うと、n₁・n₂はA群・B群のサンプルサイズ、s₁²・s₂²はA群・B群の分散です。
では、今回想定している場面から計算してみましょう。
よって、プールした分散は 13/2 であると分かりました。
t値の計算
次に t値 を計算してみます。ややこしくなりますが、地道に計算するしかありません。
よってt値は 4.35 であると分かりました。
有意差の判断
さて、t値が 4.35 であることから、有意差の有無を判断していきます。
この「t」は自由度(n₁+n₂-2)のt分布に従います。
今回で言うと自由度は 5+5-2 = 8 です。
自由度8のt分布において、両側5%の範囲にt値が存在するならば「有意差あり」と判断します。
前回同様、「t分布表(引用:統計検定2級公式問題集)」にて両側5%となるt値の確認を行います。
両側5%とは片側が2.5%となる点ということですので α=0.025 の列、自由度8の行を見ます。
よって両側5%となるt値は 2.306 と分かりました。
今回の例におけるt値は 4.35 でしたので、これは両側5%の範囲に入ります。
よって「2群の平均値に差はない」という帰無仮説が棄却されます。
つまり「A群とB群の下腿最大周径の平均値には有意差あり」と結論づけることができました!
等分散でない場合(ウェルチの検定)
ちなみに、比較する2群の母分散を等分散と仮定しない場合には「ウェルチの検定」とよばれる検定を行います。
EZRにおいても、t検定を実施する際に「等分散と考えますか?」という質問があります。
このとき「いいえ」にすると「ウェルチの検定」が実施されます。
ウェルチの検定におけるt値の求め方は次のようになります。
先程と異なるのは分母の計算ですね。
これは2群の分散が異なると仮定しているためです。
このtは次の式で求められる自由度に従います(複雑なので覚えられないかもしれませんが、実際には統計ソフトで自動計算されます)。
最近では、等分散かどうかは考えずに最初からウェルチの検定を実施する場合も多くなってきているようです。
まとめ
以上、今回は「対応のないt検定」の理論についてお話しました。
ポイントをまとめておきます。
① 独立した2群を比較する場合のt値は次の式で求める
② s²はプールした分散であり、次の式で求める
③ tは自由度(n₁+n₂-2)のt分布に従い、求めたt値が両側5%の範囲内に入るならば「有意差あり」と言える
今回はここまでです。
次回はEZRを使ってt値を計算してみようと思います。
それではお疲れ様でした。
コメント