代表値

幾何平均とは【成長率に平均をとる】

学習レベル:中学生 難易度:★☆☆☆☆

代表値(averages)とは、データの分布を特徴づけるための数字です。今回は平均を表す数値のひとつ幾何平均を紹介します。算術平均はデータを足し合わせていましたが、幾何平均はかけ算(積)で定義される平均です。

幾何平均(geometric mean)

幾何平均は算術平均と並んで非常に重要です。分かりやすく説明していくので、この機会にマスターしましょう!

具体的にどのようなものなんですか?

そうですね。下のデータを見てみましょう!

2010年2011年2012年2013年
成長率(%)1.51.32.04.0

上の表はある会社の成長率を表したものです。この成長率の平均を考えてみます。成長率の平均を出すときに、算術平均を使うのは間違いです!
実際に計算してみると、算術平均\(x_{a}\)は

\begin{align}x_{a}=\frac{1}{4}\left( 101.5+101.3+102.0+104.0 \right)=102.2\end{align}
となり平均成長率は2.2%となります。2010年の基準を1として、どのくらい成長したのか、計算してみます。

・表のデータをそのまま用いると

\begin{align}1\times \frac{101.5}{100}\times \frac{101.3}{100}\times \frac{102.0}{100}\times \frac{104.0}{100}\approx 1.0907\end{align}

となります。次に算術平均の結果を用いてどのくらい成長したのか調べてみます。正しいときは、上の結果と一致するはずです。

・算術平均の結果を用いると

\begin{align}1\times \frac{102.2}{100}\times \frac{102.2}{100}\times \frac{102.2}{100}\times \frac{102.2}{100}\approx 1.0909\end{align}

となります。とても小さい誤差ですが、異なる値となってしまいました。数学的にこのようなことが起こるとよろしくないですよね?
ここで出てくるのが幾何平均です。

幾何平均(geometric mean)
データ数\(n\)のデータ\( X_{1},X_{2},\cdots,X_{n} \)が得られたとします。このとき幾何平均\(x_{g}\)は以下のように定義されます。
\begin{align}x_{g}=\sqrt[n]{\prod_{i=1}^{n}X_{i}}=\sqrt[n]{X_{1}\times X_{2}\times\cdots\times X_{n}}\end{align}
ここで\(\sqrt[n]{\ \ }\)は\(n\)乗根を表します。

 

\(n\)乗根の計算は厄介ですが、とても簡単な式で表すことができますね♪
実際に上の表の幾何平均を計算してみましょう!

上の表の幾何平均\(x_{g}\)を求めてみると

\begin{align}
x_{g} = \sqrt[4]{101.5\times101.3\times102.0\times104.0}\approx 102.194
\end{align}

となり平均成長率は2.194%となります。先ほどと同じようにどのくらい成長したのか調べてみると、
\begin{align}
1\times \frac{102.194}{100}\times \frac{102.194}{100}\times \frac{102.194}{100}\times \frac{102.194}{100}\approx 1.0907
\end{align}

となることから、もともとのデータの成長と一致することが分かります。このような幾何平均は主に割合による変化や指数関数的変化をするデータに利用されています。

幾何平均に弱点ってあるのですか?

そうですね...
計算の構造上、正の数となっているデータにしか使用できないということです。

算術平均と幾何平均の関係(おまけ)

 対数を用いると、幾何平均\(x_{g}\)は算術平均を用いて表すことができます。証明付きで紹介しておきます。

幾何平均と算術平均
データ数\(n\)のデータ\( X_{1},X_{2},\cdots,X_{n} \)が得られたとき、幾何平均\(x_{g}\)は算術平均を用いて次のように表すことができます。
\begin{align}x_{g}=\exp\left[ \frac{1}{n}\sum_{i=1}^{n}\log X_{i} \right]\end{align}

(証明)
右辺について考えます。

\begin{align}
\exp\left[ \frac{1}{n}\sum_{i=1}^{n}\log X_{i} \right] &= \exp\left[ \frac{1}{n}\log X_{1}+\frac{1}{n}\log X_{2}+\cdots+\frac{1}{n}\log X_{n} \right] \\
&= \exp\left[ \frac{1}{n}\log X_{1}\right]\exp\left[\frac{1}{n}\log X_{2}\right]\cdots\exp\left[\frac{1}{n}\log X_{n}\right] \\
&= X_{1}^{1/n}X_{2}^{1/n}\cdots X_{n}^{1/n}\\
&= \sqrt[n]{X_{1}}\sqrt[n]{X_{2}}\cdots \sqrt[n]{X_{n}}\\
&= x_{g}
\end{align}

\(n\)乗根の計算が厄介な場合、この方法を用いた方が計算が楽になることがあるので、知識として押さえておきましょう!

幾何平均のまとめ

 成長率を表すような、割合の変化に平均をとる際は幾何平均を用います。幾何平均のデメリットは正のデータにしか使用できないことである。また\(n\)乗根の計算が厄介な場合、幾何平均を算術平均を用いた形で書き換えたものを用いることで、計算がしやすくなることがあるので、是非覚えておいてください。

その他の平均

・ 算術平均:成長率などに用いる平均です。

・ 刈り込み平均:異常値に対応するための算術平均のようなものです。

・ 調和平均:比に関する平均です。

・ 中央値(メディアン):有限個のデータに対して用いる平均です。

・ 最頻値(モード):データをカテゴリや階級別に分けたときに用いる平均です。

-代表値
-, ,

© 2024 初心者からはじめる統計学 Powered by AFFINGER5