χ(カイ)二乗検定

χ二乗検定とは?

「標本」が「母集団」から独立に測定された時(つまり、実際に測定を複数回実施した際)、統計量の分布はt分布、χ二乗分布、F分布などに従うことが分かっており、これらを使って差を検出する推計統計学の手法になります。

t分布
t分布とは、正規分布する母集団の平均と分散が未知で標本サイズが小さい場合に平均がどのように分布するかを示す確率分布のことを指します。この分布を利用した二個の変数間の有意差検定をt検定といいます。

カイ二乗分布
カイ二乗分布またはχ2分布は確率分布の一種で、推計統計学で最も広く利用されるもので、正規分布に従う変数の二乗和(分散)がなす確率分布です。この分布を用いた検定をX2検定といいます。この検定では適合性や独立性を求めることが出来ます。

F(スネデカーのフィッシャー)分布
F分布とはカイ2乗分布に従う2つの変数の比が従う確率分布です。この分布を用いた分散分析があり、三個以上の変数間の有意差検定を行うことが可能です。

t分布は、統計学カテゴリーのいくつかのページにて紹介してきましたが、正規分布に似た曲線になっています。χ二乗分布とF分布は多少異なっており、グラフであらわすと以下のようになります。χ二乗分布は自由度でのみ分布が決まります。

上記のグラフだけでは分からないと思いますが、以下の資料に書かれている通り、χ二乗検定は様々な場面で活用されています。解析は同じ原理を使いますが、適合性の検定、独立性の検定に分けることができます。