母集団と標本の違い

統計学の基礎知識

こんにちは。管理人のハル(@haru_reha)です。今回は「母集団と標本」についての説明です。職場の人達と研究や論文について話している際、母集団と標本を勘違いしている場面に遭遇することがあります。私自身も、研究を始める前は勘違いしていた所であったように思います。今回は母集団と標本の違いについてを簡単にまとめておきます。

スポンサーリンク
☆Udemyでのコース公開☆

シロート統計学講座をUdemyで公開しています。3時間の動画で、統計学の基礎からEZRでの解析実施を一気に学べます。統計解析の初心者の方でも、基本的な統計解析が実践できるレベルを目指すことができます。>>>Udemy「シロート統計学講座」

研究では何を見ているのか?

まず、普段の研究で行っている作業はどんな作業なのかを確認しておきましょう。

私は理学療法士ですので、例えば「日本において、肺切除術を受けた患者は術前後で6分間歩行距離(6MWD)がどの程度低下するのか」という疑問をもっていたとします。

この疑問を解決するために、本来は日本中で肺切除術を受けた人達を集めて6MWDを測定する必要があります。でも、現実的に考えてそれは不可能です(人数的にも、地理的にも)。

そこで、例えば自分の所属する病院で肺切除患者を受けた患者のみを対象として研究を行ったりするわけです。言うなれば「日本中の肺切除術を受けた患者さん」の一部を抜粋して、そこから全体を予測しようとしている、ということです。

これはテレビの視聴率調査でも同様です。視聴率を調べるためには、本来はテレビを見ていた人全員にアンケートをとる必要があります。でもやはりそれは難しいので一部の人のみにアンケートをとって、そこから全体の推定を行います。

つまり、普段私たちが行っている研究というのは「一部の人達を調査して、その先にある全体の傾向を推定している」ということになります。

母集団・標本とは何か?

では母集団と標本の説明に移ります。

まず、定義の確認ですが、母集団とは「調査の対象となる集合全体」のことです。一方、標本とは「母集団の部分集合」のことです。

これも、さっき挙げた「日本において、肺切除術を受けた患者は術前後で6MWDがどの程度低下するのか」という例を使って考えてみます。

この場合、調査の対象となる集合全体は「日本中の肺切除術を受けた患者さん」ですので、これが母集団に当たります。一方、母集団の部分集合は「当院で肺切除術を受けた患者さん」ですので、これが標本となります。

つまり、本当に調べたい集団全体のことを「母集団」、母集団から一部を抜粋した集団のことを「標本」と呼びます。ですので、私たちが行う研究で用いる「対象」というのは大抵の場合「標本」に当たると思います。標本を調査することで、本当に調べたい母集団のことを推定しているわけです。

ちなみに、実際に標本を集めて肺切除術前後で6MWDの変化を調べたとして、その平均が-30mであったとすると、それは「標本平均」と呼ばれます(標本で調べた平均のこと)。一方で本当に調べたい母集団の平均(真の平均)は「母平均」となります。

母平均を実際に調べることは困難ですが、理論的には存在します。標本の数が大きくなるにつれて母平均に近づくとされています。

まとめ

以上、母集団と標本について簡単に説明しました。理解すると簡単なことですが、時々「標本」に当たる集団を「母集団」と勘違いしている方がおられるので、議論の際には注意が必要かと思います。

ちなみに標本平均の標準偏差に当たる「標準誤差(standard error of the mean:SEM)」は、標本平均のばらつき具合の指標になり、母平均を推定する「推定精度」を表します。この辺りはまた別記事で書いてみようと思います。

では、また。。

コメント

タイトルとURLをコピーしました