t検定は、医学系研究で使用頻度の高い検定です。
“2群の平均値を比較する際” に用いる検定ですが、実際にどんな計算が行われているのか、よく知らない方も多いのではないでしょうか。
このシリーズは、t検定の理論を全10回の記事で理解していくものです。
t検定を理解するためには、統計学の基礎ともいえる区間推定の知識が必要となります。
まずは区間推定に関する知識の理解から始め、最終的にはt検定を理解していきましょう。
第1回:区間推定とは?
第1回では、推測統計において基本的な知識となる区間推定の概要について学んでいきます。
個人的にすごく面白いと感じる所です。ぜひ読んでみてください!
第2回:どうやって95%信頼区間を推定する?
第2回は、”実際どうやって95%信頼区間を計算するのか?” というお話です。
まずは正規分布の性質を理解し、95%信頼区間の推定の大筋を学んでいきます。
第3回:区間推定を理解するために必要な用語
第3回では、区間推定を理解するために必要な用語について説明します。
区間推定を行う際には、”母集団” と “標本” とを区別する必要があります。
母集団と標本に関する用語を理解していきます。
第4回:中心極限定理と標準化
第4回では “中心極限定理と標準化” について説明します。
統計学を学び始めてすぐの頃にはあまり馴染みのない “中心極限定理” ですが、区間推定やt検定を理解するための超重要項目となります。
また、内容自体もかなり面白いです。
第5回:母分散が分かっている場合の母平均の区間推定
第5回からは、例を用いて区間推定を実施します。
まずは一番理解しやすい “母分散が分かっている場合の母平均の区間推定” です。
現実世界では母分散が事前に分かっていることは稀かと思いますが、区間推定を理解するためには良い例となります。
第6回:母分散が分からない場合の母平均の区間推定(t分布)
第6回は “母分散が分からない場合の母平均の区間推定” についてです。
「母平均も母分散も分からない状態で、標本から母平均を推定したい」という現実的な場面での区間推定です。
ここで、本題となる “t分布” が出てきます。
第7回:EZRで母平均の区間推定を行う
第7回では、これまでに勉強した区間推定をEZRで実施し、計算が合致するかを確認します。
自分の計算とEZRの表示が合致すると、なぜだか少し嬉しさを感じます。
第8回:対応のあるt検定の理論
第8回は、いよいよ “t検定の理論” に移ります。
t検定には「対応のあるt検定」と「対応のないt検定」がありますが、まずは理解しやすい “対応のあるt検定” から説明してきます。
第9回:対応のないt検定の理論
第9回では「対応のないt検定」について説明します。
t値の計算はやや複雑になりますが、基本的な流れはこれまでに学んだ内容と同様です。
ここが、このシリーズの目的地となります。
第10回:対応のないt検定の理論をEZRで確認する
最終回となる第10回では、EZRで対応のないt検定を実施し、表示される結果が何を表しているのか、またどのように計算されていたかを確認します。
まとめ
以上、全10回で区間推定~t検定の理論を説明しています。
まずは統計学の基礎とも言える区間推定を理解し、そこから徐々にt分布の話へ移っていく過程が、個人的にすごく好きな所です。
t検定はある程度(教科書的には30以上)のサンプルサイズがあれば基本的に実施可能です。要は “平均値を比較することに意味がある場面” であれば役立つ検定と言えます。
反対に “平均値を比較することの意味がない場面” では、ノンパラメトリック検定であるマンホイットニーのU検定を使用した方が良いと思われます。
平均値を比較することに意味がない場面というのは、分布のばらつきが大きく、平均値がその分布の代表値として相応しくない場合や、順序変数を比較する場面などです。
ある程度の理論を理解した上で、研究での解釈を行っていけるようにしたいですね。
お読みいただき、ありがとうございました。
コメント