学習レベル:中学生 難易度:★☆☆☆☆
算術平均、中央値と並んでよく使用されるのが最頻値です。最頻値は中央値と同様に非対称な分布をしているデータに用います。普通は名義尺度のデータには算術平均、中央値などで平均をとることができません。最頻値の最大の特徴は名義尺度にも利用できる点です。
最頻値とは
度数分布表について分かっていればとても簡単です。
最初に最頻値の定義をしておきましょう!
定義はとても簡単ですね!
そうですね!具体例を2つ見てみましょう!
■例1
度数分布表の記事で作成した度数分布表を見てみましょう!
階級 | 階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
\( 0 \)~\( 10 \) | \( 5 \) | \( 3 \) | \( 0.06 \) | \( 3 \) | \( 0.06 \) |
\( 10 \)~\( 20 \) | \( 15 \) | \( 2 \) | \( 0.04 \) | \( 5 \) | \( 0.10 \) |
\( 20 \)~\( 30 \) | \( 25 \) | \( 6 \) | \( 0.12 \) | \( 11 \) | \( 0.22 \) |
\( 30 \)~\( 40 \) | \( 35 \) | \( 8 \) | \( 0.16 \) | \( 19 \) | \( 0.38 \) |
\( 40 \)~\( 50 \) | \( 45 \) | \( 3 \) | \( 0.06 \) | \( 22 \) | \( 0.44 \) |
\( 50 \)~\( 60 \) | \( 55 \) | \( 6 \) | \( 0.12 \) | \( 28 \) | \( 0.56 \) |
\( 60 \)~\( 70 \) | \( 65 \) | \( 10 \) | \( 0.20 \) | \( 38 \) | \( 0.76 \) |
\( 70 \)~\( 80 \) | \( 75 \) | \( 5 \) | \( 0.10 \) | \( 43 \) | \( 0.86 \) |
\( 80 \)~\( 90 \) | \( 85 \) | \( 4 \) | \( 0.08 \) | \( 47 \) | \( 0.94 \) |
\( 90 \)~\( 100 \) | \( 95 \) | \( 3\) | \( 0.06 \) | \( 50 \) | \( 1.00 \) |
計 | \( 50 \) | \( 1 \) |
度数に注目してください。一番大きい度数は\(10\)です。この度数に対応する階級値が最頻値なので、求めたい最頻値\(x_{mo}\)は$$x_{mo}=65$$となります。
■例2
次のデータは生徒9人分の評定です。このデータの最頻値を調べてみましょう!
生徒A | 生徒B | 生徒C | 生徒D | 生徒E | 生徒F | 生徒G | 生徒H | 生徒I | |
評定 | 4 | 4 | 5 | 3 | 3 | 4 | 4 | 5 | 5 |
度数分布表を作成してみると
階級・階級値 | 度数 | 相対度数 | 累積度数 | 累積相対度数 |
1 | 0 | 0 | 0 | 0 |
2 | 0 | 0 | 0 | 0 |
3 | 2 | 0.22 | 2 | 0.22 |
4 | 4 | 0.44 | 6 | 0.66 |
5 | 3 | 0.33 | 9 | 1 |
計 | 9 | 1 |
となります。一番大きい度数は\(4\)です。この度数に対応する階級値が最頻値なので、求めたい最頻値\(x_{mo}\)は$$x_{mo}=4$$となります。
最頻値の弱点ってなんですか?
感が良い方は気づいたかもしれませんが、一番大きい度数はひとつとは限りません。つまり最頻値が、だだひとつに定まらないことがあります。
最頻値のまとめ
最頻値は算術平均、中央値と並んでよく使用される平均です。最頻値はデータの分布が非対称なものに使用され、名義尺度のデータにも使用できるところが最大の特徴です。しかし、最頻値がひとつに定まらない場合もあるので注意が必要である。
その他の平均
・ 算術平均:様々な性質をもつ、最もポピュラーな平均です。
・ 刈り込み平均:異常値に対応するための算術平均のようなものです。
・ 幾何平均:成長率などに用いる平均です。
・ 調和平均:比に関する平均です。
・ 中央値(メディアン):有限個のデータに対して用いる平均です。