代表値

刈り込み平均とは【算術平均の弱点を克服する】

 代表値(averages)とは、データの分布を特徴づけるための数字です。代表値の中でも平均はよく使用されています。算術平均を説明した際に、デメリットがあることも説明しました。このデメリットを克服するために、算術平均に一工夫したものが刈り込み平均(トリム平均とも呼びます)です。

刈り込み平均とは

刈り込み平均ってあまり聞いたことがないのですが
どのような平均なんですか?

あまり馴染みのない平均ですが、実はスポーツの世界で使われています。具体的にはスケートなどの審査員が採点するような運動競技で利用されています。

なぜスポーツ競技で用いられるのですか?

選手への公平性を保つために用いられます。
採点員が極端な点数(特定の選手への肩入れなど)をつけると、公平に評価されないですよね?
このようなことがないように刈り込み平均を使います。

刈り込み平均(trimmed mean)
データ数\(n\)のデータ\( X_{1},X_{2},\cdots,X_{n} \)が得られたとします。このとき刈り込み平均\(x_{t}\)は以下のように定義されます。

1:データを小さい順に並び替えます。並び変えたものを改めて\( X_{1}^{\ast},X_{2}^{\ast},\cdots,X_{n}^{\ast} \)とします。

2:両端から同じ量だけデータを削除します。

3:残ったデータで算術平均をとったものを刈り込み平均\(x_{t}\)とする。

具体的な例を使って刈り込み平均を求めてみます。次の表は8人の審査員が評価した点数をまとめたものです。

  A B C D E F G H
点数 3 4 4 5 3 4 8 5

まず、データを小さい順に並び替えます。上の表から並び替えると下のようになります。

\begin{align}
X_{1}^{\ast}=3,\ \ X_{2}^{\ast}=3,\ \ X_{3}^{\ast}=4,\ \ X_{4}^{\ast}=4,\ \ X_{5}^{\ast}=4,\ \ X_{6}^{\ast}=5,\ \ X_{7}^{\ast}=5,\ \ X_{8}^{\ast}=8
\end{align}

このあと、両端からデータを削除します。今回は両端から1個削除してみたいと思います。削除する個数に決まりはありませんが、削除すればするほどデータ数が少なくなるので、削除したあとのデータ数も考えて適切な量を削りましょう。データを削除すると次のようになります。

\begin{align}X_{2}^{\ast}=3,\ \ X_{3}^{\ast}=4,\ \ X_{4}^{\ast}=4,\ \ X_{5}^{\ast}=4,\ \ X_{6}^{\ast}=5,\ \ X_{7}^{\ast}=5\end{align}

あとは、残ったデータで算術平均をとれば刈り込み平均となります。

\begin{align}
x_{t} = \frac{1}{6}\sum_{i=2}^{7}X_{i}^{\ast} &= \frac{1}{6}\left( X_{2}^{\ast}+X_{3}^{\ast}+\cdots+X_{7}^{\ast} \right) \\
&=\frac{1}{6}\left( 3+4+\cdots+5 \right) \\
&=4.166...
\end{align}

どうですか?
算術平均と計算の手間はあまり変わりませんよね?
この機会に刈り込み平均というものを覚えてみてはいかがでしょうか?

刈り込み平均のまとめ

刈り込み平均は、算術平均のデメリットであった異常値に弱いという点を克服するための平均の取り方です。主に、スポーツ競技の点数採点に使用されており不公平さをなくすため利用されています。注意点として、データを削除する際、残るデータの数には注意が必要であり、データ数が少ない場合には利用できない場合があります。

その他の平均

・ 算術平均:様々な性質をもつ、最もポピュラーな平均です。

・ 幾何平均:成長率などに用いる平均です。

・ 調和平均:比に関する平均です。

・ 中央値(メディアン):有限個のデータに対して用いる平均です。

・ 最頻値(モード):データをカテゴリや階級別に分けたときに用いる平均です。

-代表値
-, ,

© 2024 初心者からはじめる統計学 Powered by AFFINGER5