回帰分析と相関係数

回帰分析とは?

回帰分析とは、データ(測定値)を関数に当てはめることによって、データ相互の関係性を検討するための手法です。代表的な例として吸光度が挙げられます。以下のように、濃度と吸光度には直線的な関係があることが分かります。

上記に吸光度の例を記したように、回帰分析においては直線や曲線に対してあてはめることにより、実測値に最も近い直線や曲線の関数式を求めることが出来ます。

この関数式を求めるにあたり、実測値と近似値の差を最も小さくするために、差の自乗和を最も小さくするように関数の係数をきめており、最も確からしい関係式を求めるにおいて重要となる方法を最小二乗法といいます。

重回帰分析と単回帰分析

回帰分析には重回帰分析単回帰分析の二種類が存在します。この大きな違いは、分析を行うにあたり用いる変数の数です。重回帰分析では二つ以上の変数から関係性を導き出し、単回帰分析では一つの変数から関係性を導き出します。

単回帰分析の式は、この関数をグラフに表した時、係数aは傾き、係数bは切片となります。これらから直線が表されます。そしてこの直線のxとyの直線性の関係性の強さを示すものが相関係数です。

相関係数

相関係数は+1から-1の間の値で表されます。+1に近いほど強い正の相関があり、-1に近いほど強い負の相関があると言います。以下、グラフと相関係数の例を示しています。

相関係数が0.8であるグラフ想定した際、一概に同じグラフになる訳ではありません。以下のように直線にそって上下にばらついたグラフ、曲線的にばらついたグラフ、部分的にばらついたグラフ、一部に集合しているグラフなど、さまざまなパターンのデータから同じ相関係数が得られる場合があります。