分散分析と多重比較:エクセルを使った解析方法まで解説!

分散分析とは?

前回まで学んだt検定は2標本の平均値に差があるかを検定する方法でしたが、ここで学ぶ分散分析は3群以上からなるデータや1つのデータに2つの要素を含むデータの有意差を検定する方法です。データの分散を基に分析する方法で、t検定より多くの要因をまとめて分析することができる分析方法です。

測定データは、バラつかない部分(平均値)とバラつく部分を足し合わせたものとして表すことが可能です。そしてバラつく部分の程度を表すものが分散であると言えます。

t検定の帰無仮説のように「すべての群で平均と分散が同じ」であるとすると、分散の比は1となるはずです。逆に、比較する群に違いがある場合は分散の比が1より大きくなることが分かるかと思います。

分散分析の種類とエクセルを使った解析

分散分析の種類は測定結果に影響を与える原因である要因によって分けられます。

一元配置の分散分析

要因が1つの場合を一元配置法(一元配置の分散分析, one-way ANOVA)といいます。1つの因子からなるデータを分析する方法で、因子に含まれる水準間の平均値の差を見ることが出来ます。簡単に言えば、t検定は2つを比較する分析でしたが、それが3つ以上になった場合に適用できます。

一元配置の分散分析では、3つ以上の群について差を検出することができますが、どの群間に差があったかどうかを判断することができません。これには、後述する多重比較が必要になります。

二元配置の分散分析と交互作用

要因が2つの場合を二元配置法(二元配置の分散分析, two-way ANOVA)といいます。例えば、これまでに示した健康食品の事例のように、本物と偽物(プラセボ)を比較する場合などに適用されます。

事例の中であったように、時間変化がある場合には、さらに特別な分析が適用されます。これには繰り返しのある二元配置分散分析(反復測定分散分析、two-way repeated ANOVA)が必要です。

二元配置の分散分析は二つの因子からなるデータを分析する方法で、各因子における水準間の平均値の差を見ることが出来ます。そしてこのとき、交互作用の検定もできます。交互作用とは要因間での影響を指し、要因Aの程度によって要因Bの効果が影響を受けるような場合にのみ交互作用検定が導入されます。具体的には、要因Aを摂取したサンプル(本物と偽物)、要因Bを時間として、摂取した前後で効果があった場合は交互作用が検出されます。

エクセルの分析ツールによる分散分析

分散分析を実行するにあたり分析ツールを使用することが出来ます。分析ツールには「分散分析:一元配列」「分散分析:繰り返しのない二元配列」「分散分析:繰り返しのある二元配列」があります。これらを選択し、実行することで検定を行うことが出来ます。

「観測された分散比」と「F境界値」を比較する必要があります。境界値より小さい時、帰無仮説が成立し差があるとは言えないのに対し、境界値が大きい時、有意の差があると言えます。そして「P-値」は何%水準で有意になるかを示しています。

分散分析の練習問題

以下は分散分析に関する練習問題になります。理解度を把握するためにも、ぜひ挑戦してみてください。エクセルの操作が分からない場合、参考になる動画がYoutubeに多くあります。その1つを掲示してみましたので、参考にしてください。

アイコン
分散分析の課題