トップページ > 数学 > 【母集団と標本】

【母集団と標本】
統計学の目的も解説

統計学で用いられる母集団標本の概念について学習していきます。

統計学の目的につながる本質的内容なので理解しておきたいところです。

母集団と標本

何らかの調査を行う際、調査対象は明確に定める必要があります。その調査対象は多くの場合 複数要素を持っておりそれらの集合体を集団と呼び表すことにします。

そして考えられる要素全てを含む集団のことを母集団 ( Population ) と呼びます。

例えば、地球上に住む人類を母集団としたとき、誰ひとりとして欠けることのない集団を考えることになります。

母集団と標本

一方で、母集団から一部を抽出した要素で調査することがあります。この抽出された一部のことを標本 ( Sample ) と呼びます。

標本は母集団から取り出されいているので、言うまでもなく母集団全体の情報を表すものではない事は理解できるでしょう。

全数調査と標本調査

調査対象が母集団か標本かによって、調査方法に名称が与えられています。

それぞれ全数調査標本調査と呼びます。

全数調査 標本調査
調査対象 母集団 標本

これらはそれぞれ長所と短所があります。

全数調査は母集団全体を調査対象とするので、母集団の情報を正しく把握することが可能です。ところが母集団を形成する要素がとてつもなく大きい場合、その調査に要する時間と費用は計り知れません。

一方で標本調査は、母集団からいくつか抽出した標本を調査すればよいので、任意の調査回数でデータを取ることができます。しかしながら母集団全体の情報を完全に把握することは不可能です。

断言はできませんが、全数調査を行うことは滅多にないでしょう。

つまり母集団から標本を抽出し、そこから情報を得る手法が主となります。

では、母集団の情報を知り得る術は無いのか?…その問題を解決するのが統計学です。

統計学では、標本から母集団の情報を得ることを目的としてあらゆる手法を展開していきます。

ここで言う母集団の情報とは、母平均 \(\mu\)母分散 \(\sigma^2\) と呼ばれる未知数です。

平均と分散については、標本について定義される標本平均と標本分散を見たほうが理解はし易いと思いますが、ここでは本筋から外れるので割愛します。

母集団の情報を誤って解釈しないために

標本を抽出する際の注意点 : ランダムサンプリング

多くの場合、母集団の情報を知るために標本を抽出して調査を行いますが、このとき注意しなければならない事があります。

例えば日本に住む国民を母集団として定めたとき、標本として適切と考えられるのは母集団の縮図となっている集団でしょう。

しかしながら調査が行いやすいなどの理由により、20代の国民が調査対象の大半を占めていたとすれば、導かれる母集団の情報として誤った解釈を与える恐れがあります。

この誤りを回避するために、抽出される標本は無作為に選ばれる必要があります。これをランダムサンプリング ( 無作為抽出 ) と言います。

例えば くじ引きなどはランダムサンプリングの例として分かりやすいでしょう。

母集団を定める

不適切な調査による母集団情報の誤解を防ぐために、その他何を母集団として定めたかも重要事項です。

例えば日本国民を母集団として ある新薬の効果に関する調査を考えましょう。

調査の結果、標本として選ばれた被験者のなかで20代のみが新薬の効果が確認されたとします。

さてこのとき、母集団に対して新薬の効果は期待されるかと言うとNOです。なぜなら母集団は日本国民であり、様々な年代の方がいるからです。

他方で、母集団を20代に限定すれば、この新薬の効果はあると判断することができます。

最も犯してはいけない過誤は、20代のみの集計を行い、20代以外の集計を行わない段階でこの新薬は効果があると判断してしまうことです。

あらかじめ母集団を明確に定めておくことで、このような過誤を防ぐことができます。

【サイト運営 : だいご】

今年で物理化学歴11年目になります。

大学入試2次数学でたった3割しか得点できなかったいわゆる数弱落ちこぼれ。それでも好きこそものの上手なれと言ったところか、学会で最優秀賞受賞したり首席卒業できてしまったので、役に立つ知識を当サイトに全て惜しみなく公開しようと思います。ブックマークをオススメ。