対応のないt検定の理論

統計学の基礎知識

t検定の理論を分かりやすく解説【第9回】

前回は「対応のある」t検定の理論について説明しましたが、今回は「対応のない」t検定の理論についてのお話です。

「対応のある」t検定では2群間の差に注目し、実際には1群でt検定を行うだけでよかったですが、「対応のない」2群を比較する場合にはt値の求め方が少し複雑になります。

「対応のない」t検定では

① 2群の母集団が等分散とみなせる場合
② 2群の母集団が等分散とみなせない場合

でt値の求め方が異なります。今回はいわゆる一般的なt検定である①について説明します。

スポンサーリンク
☆Udemyでのコース公開☆

シロート統計学講座をUdemyで公開しています。3時間の動画で、統計学の基礎からEZRでの解析実施を一気に学べます。統計解析の初心者の方でも、基本的な統計解析が実践できるレベルを目指すことができます。>>>Udemy「シロート統計学講座」

想定する場面

想定する場面は、次のような場面です。

A群(n=5)とB群(n=5)で下腿最大周径を測定した.A群は平均37㎝,分散9であった.B群は平均30㎝,分散4であった.このとき,A群とB群の平均値には統計学的有意差があるかを検証したい.なお,この2群の母集団は等分散であるとみなす.

この場合、A群・B群とも母平均と母分散の具体的な数値は分からない状態です。分かっているのはA群・B群の標本平均、標本分散のみです。

t値の計算式

「対応のない」t検定における「t値」の計算方法は次のようになります。

前回までに学習したt値と比べて、求め方が複雑に感じると思います。この式については、覚えるしかないかもしれません。ちなみにこの「t値」は自由度(n₁+n₂-2のt分布に従います。

分子については「A群の平均値からB群の平均値を引いた値」となっています。つまり「A群とB群の平均値の差」です。これは大丈夫でしょう。

問題は分母ですね。まず、ここでの「s²」は「プールした分散」と呼ばれ、「A群とB群の分散をまとめたもの」というイメージです。

「プールした分散」の計算方法は次のようになります。

こちらもややこしいですね。分子は両群における 「(サンプルサイズから1を引いた値)×標本分散(不偏分散)」 を足したものですね。そして分母は「両群をまとめた自由度(A群とB群のサンプルサイズを足して2を引いた値)」です。

実際に計算してみよう

では、今回想定している場面から、実際にt値を計算してみましょう。

まずは「プールした分散」の計算です。

この計算により、プールした分散は13/2であると分かりました。

次に「t値」を計算してみます。少しややこしくなりますが、地道に計算するしかありません。

よって「t値」は2.69であると分かりました。

有意差の判断

さて、「t値」が2.69であるということから、有意差の有無を判断していきます。

この「t」は自由度(n₁+n₂-2)のt分布に従います。今回で言うと自由度は(5+5-2)=8 です。

自由度8のt分布において、両側5%の範囲に「t値」が存在するならば「有意差あり」となります。

前回と同様に「t分布表(引用:統計検定2級公式問題集)」にて両側5%となる「t値」の確認を行います。両側5%ということは片側が2.5%となる点ということですので α=0.025 の列、そして自由度8の行を見ます。

よって両側5%となる「t値」は 2.306 と分かりました。

今回の例における「t値」は2.69でしたので、これは両側5%の範囲に入ります。

つまり「A群とB群の下腿最大周径の平均値には統計学的有意差あり」と結論づけることができました!

等分散でない場合(ウェルチの検定)

ちなみに、比較する2群の母分散が等分散と仮定できない場合には「ウェルチの検定」とよばれる検定を行います。EZRにおいても、t検定を実施する際に「等分散と考えますか?」という質問があります。このとき「いいえ」にすると「ウェルチの検定」が実施されることになります。

ウェルチの検定では「t値」の求め方は少しシンプルになります。分子は2群の差の絶対値、分母は「各群の分散をサンプルサイズで割った値の和」にルートをつけた値となります。

この時の「t値」は次の式で求められる自由度に従います。これはかなり複雑になりますので、なかなか覚えられないかもしれません。実際には統計ソフトで自動的に計算されます。

最近では、等分散かどうかは考えず、最初からウェルチの検定を実施する場合も多くなってきているようです。

まとめ

以上、今回は「対応のないt検定」の理論についてお話しました。ポイントをまとめておきます。

POINT

① 独立した2群を比較する場合の「t値」は次の式で求める

 

② s²は「プールした分散」であり、次の式で求める

 

③ 「t値」は自由度(n₁+n₂-2)のt分布に従い、求めた「t値」が両側5%の範囲内に入るならば「有意差あり」と言える

「対応のある」t検定と比べると、「t値」の求め方が少し複雑になりますが、慣れてしまえばそれほど難しくはありません。

今回はここまでです。次回はEZRを使ってt値を計算してみようと思います。それではお疲れ様でした。

コメント

タイトルとURLをコピーしました