ヒストグラム

統計学カテゴリーの第四回目まではエクセルの基本関数やルールについて学んできましたが、このヒストグラムからは統計に関する本質に少しずつ近付いていきます。ヒストグラムから箱ひげ図、正規分布などについて学びます。

ヒストグラムについて、以下の動画を予め確認しておくと、以後の説明が理解しやすくなります。

(統計学)5.統計Aヒストグラム

測定誤差の種類

私たちが測定を行うにあたり、様々な誤差が生じてきます。誤差は大きく分けて、過失誤差、系統誤差、偶然誤差が存在します。過失誤差とはひどい誤りやうっかりミスのことを指し、データとして使用できないものを指します。

次に系統誤差についてです。系統誤差はシステムエラーと呼ばれており、原因がはっきりしていて、常に一定方向に誤差が生じてしまうといった誤差のことを指します。この誤差は主に、機器誤差、理論誤差、個人誤差が原因であるとされています。つまり補正値などといった十分な対策によって、有効数字の精度で無視できるほど小さくなり得ます。

そして偶然誤差とはランダムエラーとも呼ばれており、測定値自身の本質的なばらつきのことを表し、本講義以降に主に勉強していく誤差がこの偶然誤差です。偶然誤差の補正に関しましては、本質なばらつきである為、最終としては熱的な現象などといった原子、分子レベルの誤差となってしまうため、数値的な意味でこれらの誤差を抑えることは非常に難しいとされているのです。

つまり偶然誤差に関しましては、このばらつきのなかでいろいろなことを予測する必要がある為、乱数とは異なり、ある程度の分布が生じます。この分布こそが正規分布という分布をするとされているため、統計学を学ぶにおいて正規分布を学ぶ必要があります。

ヒストグラム

本ページでは、正規分布の基礎となるデータがばらついている様子を評価する方法、ヒストグラムについてご紹介いたします。

データのばらつきとは、数直線上に頻度に沿ってデータを記した際に、頻度を縦軸、データを横軸とすることでグラフを示すことが出来、平均値や極大値を表すことが出来ます。このデータを理論的に解析したものが正規分布となるのです。

貝殻の大きさをヒストグラム化

このような数の散らばり(ばらつき)の例として、貝殻の大きさを測定してみました。

貝殻自身には生物学上における基本的な貝殻の本質的な大きさが生じます。この貝殻の本質的な大きさをもとにそれぞれ大きさにばらつきが生じてきます。

はかり終えたデータを度数分布表にそれぞれ記載していきます。

度数分布表とはデータ区間における頻度の数を表に表したもので、相対的な頻度の割合を数値的に可視化することが出来る表です。

このデータをもとにエクセルの表を作る機能をもちいてヒストグラム化します。

手書きの正方形の大きさをヒストグラム化

もう1つの例として、ご自身で約5mmの大きさの正方形を50個ほど適当に記し、その長さを各々量り、度数分布の作成、そしてそのデータをもとにヒストグラムの作成に試みてください。

ヒストグラムは統計的視点の基本であり、グラフの作成方法も習得してみて下さい。

タイトルとURLをコピーしました