代表値

範囲(レンジ)とは【データの存在範囲を知る】

学習レベル:中学生 難易度:★☆☆☆☆

データのばらつきを表す数字で一番簡単な方法です。範囲(レンジ)とはデータが存在する範囲を表したものです。この記事では範囲の求め方と、どのような特徴があるのか、具体例を交えてまとめていきたいと思います。

範囲とは

範囲はとても簡単です。最初に定義を見ていましょう!

範囲(range)
データ\( X_{1},X_{2},\cdots,X_{n} \)が得られたとします。このデータの最小値を\(X_{min}\)、最大値を\(X_{max}\)としたとき、範囲\(R\)は以下のように定義されます。 $$R=X_{max}-X_{min}$$

範囲の弱点は、極端な大きさのデータに反応してしまうところにあります。たとえば極端に大きいデータが1つでもあると、範囲が広くなりすぎてしまいます。

大事なのは範囲をどのように考えるかです。
実際の具体例を見てみましょう!

■具体例
次のデータはA君、B君の5教科のテスト点数である。このデータについてみてみよう!

  国語 算数 社会 理科 英語
A君 45 60 63 40 42
B君 90 12 23 30 95

 A君の最低点数は40点、最高得点は63点なので範囲\(R_{A}\)は$$R_{A}=63-40=23$$となります。
 同様に、B君の範囲\(R_{B}\)は最低点数が12点、最高得点が95点ということを用いると$$R_{B}=95-12=83$$となります。ここで、A君・B君の平均点を求めると、共に50点となります。このことから、どのようなことがわかるか考えてみましょう!

まず平均点の情報からA君とB君は同じ程度の学力があることがわかります。
次に範囲の情報を見てみるとA君の方が、B君より範囲が狭いことがわかります。
つまり、A君はB君より得意科目と不得意科目の差が小さいことがわかり、B君はその逆で、得意科目と不得意科目の差が大きいということになります。
このように、範囲を用いると平均だけではわからないデータの散らばり方を知ることができます。

範囲のまとめ

範囲はデータのばらつきを表す最も簡単な方法です。計算方法も簡単でデータの最小値・最大値が分かれば引き算をするだけでいいのです。範囲の弱点は極端に小さい・大きいデータが存在すると範囲が極端に大きくなってしまうということです。

その他の散布度

四分位数:有限個のデータに対して使用できる散布度です。

パーセンタイル:四分位数の上位互換になる散布度です。

分散・標準偏差:散布度の中で最もポピュラーなものになります。

平均偏差:絶対値で平均との誤差を測ることで散布度を計算する方法です。

変動係数:平均が異なるデータ同士でも、比較することができる散布度です

標準得点:観測値が平均とどのくらい離れているかを表す散布度です。

-代表値
-, ,

© 2024 初心者からはじめる統計学 Powered by AFFINGER5