統計学を始めるに際して

統計学のカテゴリーでは、高度な統計学というよりも、実用的な統計に関する基礎な知識やソフトウェアの操作を中心に理解することを目的としています。高度な統計解析が実施できるソフトウェアがいくつか知られていますが(研究論文の統計解析にはSPSSやR等を利用しています)、こちらではExcelで可能な範囲で説明をしています。

主に取り扱うものとしてはデータ解析などに利用するためのエクセルの基本操作、測定結果をグラフとして適切に可視化する際に主に利用する散布図の挿入、更にデータ整理などを簡易化するためのやや応用的な関数の利用といったステップで進む予定です。

パソコンやExcelに慣れていない方にとって、難しく感じる方もいらっしゃると思いますが、これらの内容を10回以上に分けて丁寧に解説していきたいと思います。

統計学を始めるに際して

統計とは?

では早速、本題に入っていきたいと思います。

私たちの身の回りにはたくさんの数値的なデータが存在し、それらのデータによって現代社会の諸活動が営まれています。統計学の根本には確率があります。

まず基本となる確率から見ていきましょう。

立方体のサイコロを振った際に1の目が出る確率は6分の1であることから16.6%と示すことが出来ます。

この場合、この確率はほかの因子に影響を受けることはないため”事象が「独立」している“と表すことが出来ます。

このように普段触れている数値的なデータをより細分化、専門的に解析するために本講義を有効的に活用していただけたらと思います。これらの内容を順に取り扱っていく予定となっております。

バラツキ(標準偏差)と有意差

統計解析に関する事例の一つを紹介いたします。

肥料A、肥料Bを用いて育てた植物を半年後、4つをの試料をサンプリングしその乾燥重量測定後の数値の有効性を求めています。

上記のデータの判断として、肥料Bの方が平均値が高く、効果が高かったと考えてしまいがちです。しかしながら、統計的に解析をすると『有意の差』があるとはいえない事例になります。それは、データのバラツキを数値化する『標準偏差』が大きいことが尺度となっています。つまり、これらのデータを統計的に解析すると有意の差はない為、肥料Bの値が高かったことは偶然であり、同じ結果が再現される可能性は低いと考えられます。

次に事例の二つ目を紹介いたします。

二つ目は、一つ目の事例とは異なり、統計的に『有意な差』がある場合です。その結果は『p値』という尺度で判断されます。この値が0.05未満である時、科学的に差があると判断されます。

統計学では帰無仮説を否定して、対立仮説が正しいことを示す手順になります。帰無仮説とは、否定される目的のための仮説であり、対立仮説とは帰無仮説に対立する仮説の事を指します。帰無仮説では実際にデータから計算された統計量よりも極端に反する統計量が観測できる確率があり、この値を『p値』とされているのです。よってp値によって結果が得られる確率を求めることが出来、その結果の信憑性などに影響を与えることが出来るのです。

検量線の作成やその他の事例

次に事例の三つ目を紹介いたします。

三つ目は検量線の作成です。理系の学部でしたら、必須ともいえるグラフであり、吸光度などを求める際に検量線は必要不可欠となっております。濃度や透過率、吸光度をグラフとそれらから求められる近似式を用いて相関的に求めることが出来、更に決定係数などから、データの分散度などを求めることもできます。

他にも事例を紹介すると、以下のような事例があり、これらも理系の方々には必要不可欠なエクセル操作です。今後の講義において教授いたしますので、ご安心ください。

統計に関する参考資料

これらの説明を行うにあたり、参考書は以下の通りです。

タイトルとURLをコピーしました