統計を始めるに際して

統計とは?

では早速、本題に入っていきたいと思います。

私たちの身の回りにはたくさんの数値的なデータが存在し、それらのデータによって現代社会の諸活動が営まれています。統計学の根本には確率があります。

まず基本となる確率から見ていきましょう。

立方体のサイコロを振った際に1の目が出る確率は6分の1であることから16.6%と示すことが出来ます。

この場合、この確率はほかの因子に影響を受けることはないため”事象が「独立」している“と表すことが出来ます。

このように普段触れている現象について確立や統計として考えていくことが第一歩となります。

バラツキ(標準偏差)と有意差

統計解析に関する事例の一つを紹介いたします。

肥料A、肥料Bを用いて育てた植物を半年後、4つをの試料をサンプリングしその乾燥重量測定後の数値の有効性を求めています。

上記のデータの判断として、肥料Bの方が平均値が高く、効果が高かったと考えてしまいがちです。しかしながら、統計的に解析をすると『有意の差』があるとはいえない事例になります。

それは、データのバラツキを数値化する『標準偏差』が大きいことが尺度となっています。つまり、これらのデータを統計的に解析すると有意の差はない為、肥料Bの値が高かったことは偶然であり、同じ結果が再現される可能性は低いと考えられます。

次に事例の二つ目を紹介いたします。

二つ目は、一つ目の事例とは異なり、統計的に『有意な差』がある場合です。その結果は『p値』という尺度で判断されます。この値が0.05未満である時、科学的に差があると判断されます。

このp値という数値やその算出方法は、後に詳細に説明をしています。