学習レベル:中学生 難易度:★☆☆☆☆
データのばらつきを表す数字で一番簡単な方法です。範囲(レンジ)とはデータが存在する範囲を表したものです。この記事では範囲の求め方と、どのような特徴があるのか、具体例を交えてまとめていきたいと思います。
範囲とは
範囲はとても簡単です。最初に定義を見ていましょう!
範囲の弱点は、極端な大きさのデータに反応してしまうところにあります。たとえば極端に大きいデータが1つでもあると、範囲が広くなりすぎてしまいます。
大事なのは範囲をどのように考えるかです。
実際の具体例を見てみましょう!
■具体例
次のデータはA君、B君の5教科のテスト点数である。このデータについてみてみよう!
国語 | 算数 | 社会 | 理科 | 英語 | |
A君 | 45 | 60 | 63 | 40 | 42 |
B君 | 90 | 12 | 23 | 30 | 95 |
A君の最低点数は40点、最高得点は63点なので範囲\(R_{A}\)は$$R_{A}=63-40=23$$となります。
同様に、B君の範囲\(R_{B}\)は最低点数が12点、最高得点が95点ということを用いると$$R_{B}=95-12=83$$となります。ここで、A君・B君の平均点を求めると、共に50点となります。このことから、どのようなことがわかるか考えてみましょう!
まず平均点の情報からA君とB君は同じ程度の学力があることがわかります。
次に範囲の情報を見てみるとA君の方が、B君より範囲が狭いことがわかります。
つまり、A君はB君より得意科目と不得意科目の差が小さいことがわかり、B君はその逆で、得意科目と不得意科目の差が大きいということになります。
このように、範囲を用いると平均だけではわからないデータの散らばり方を知ることができます。
範囲のまとめ
範囲はデータのばらつきを表す最も簡単な方法です。計算方法も簡単でデータの最小値・最大値が分かれば引き算をするだけでいいのです。範囲の弱点は極端に小さい・大きいデータが存在すると範囲が極端に大きくなってしまうということです。
その他の散布度
・四分位数:有限個のデータに対して使用できる散布度です。
・パーセンタイル:四分位数の上位互換になる散布度です。
・分散・標準偏差:散布度の中で最もポピュラーなものになります。
・平均偏差:絶対値で平均との誤差を測ることで散布度を計算する方法です。
・変動係数:平均が異なるデータ同士でも、比較することができる散布度です
・標準得点:観測値が平均とどのくらい離れているかを表す散布度です。