信頼区間と棄却判定

測定値から正規分布まで

測定値とは、測定によってもとめた値であり、個々の測定によって得られた生の値、補正を施した値、平均値、そのほか調整を施した値など、目的に応じて得られた結果を測定値といいます。

測定値を扱うにあたり、その全体を指す言葉として『標本』と『母集団』があります。

これらの明確な違いとしては、『標本』は母集団からサンプル数を決めて測定したデータの組のことを指し、得られた結果、つまり実際の測定データの集りのことを指します。標本に基づく分散はVAR()で表すことが出来、また標本に基づく標準偏差はSTDEV()で表すことが出来ます。

一方で『母集団』はデータ数が無限にあるデータの集りのことを指します。

今回は推計統計学という事もあり、あくまで母集団はデータ数が無限にある【と仮定した】データの集りのことを指してします。母集団に基づく(不偏)分散はVARP()で表すことが出来、また母集団に基づく(不偏)標準偏差はSTDEVP()で表すことが出来ます。

これらデータを扱うにあたり、測定値には少なからず誤差というものが存在します。誤差を大きく分けると系統誤差、偶然誤差があり、統計学ではデータが偶然誤差しか含まない場合はそのばらつきは正規分布(ガウス分布)するという前提で推定を行います。

これはつまり、データが増えるにつれ、その分布は正規分布に近づくことを指し、以下のグラフは実際の事例になります。

標本(データ)から正規分布の仮定

この正規分布と標準偏差には関係性があり、以下の式で示すことができます。

数が少ないデータ(標本)から数が多いデータ全体(母集団)を推定する必要がある場合は、数が少ないデータをもとに、正規(ガウス)分布を仮定するといった方法があります。

では実際に数の少ないデータ(標本)から求まった平均値や標準偏差ともとのデータとの関係を観ていきましょう。そうすると、少ない測定値(標本)から予想される正規分布は、数が多くなっても大きく変わらないことが分かります。