指数分布(exponential distribution)は連続型の確率分布です。指数分布はある事象が起こってから、次に事象が発生するまでの期間をあらわす確率分布になります。
具体的には、ある生産ラインで作成された製品の中で不良品が発見されてから、次に不良品が発見されるまでの期間が指数分布になります。
指数分布は、ある期間の間に起こる事象の回数を\(\lambda\)回としたとき、事象が発生してから次に事象が発生するまでの期間を\(X\)とすると、\(X\)はパラメータ\(\lambda\)の指数分布に従うといい、記号\(X\sim Exp(\lambda)\)で表されます。
似たような分布にポアソン分布がありますが、こちらは離散型の確率分布で、ある一定期間の間に事象が発生する回数を表します。詳しくは下のリンクからご覧ください。
目次
指数分布の基本情報
※ 表は横にスクロールできます。
パラメータ | \(0 < \lambda\) |
確率変数の範囲 | \(0\leq x \) |
累積分布関数 | \(\displaystyle 1-\exp\left[-\lambda x\right]\) |
確率密度関数 | \(\displaystyle\lambda\exp\left[ -\lambda x \right]\) |
逆生存関数 (確率\(p\)) |
\(\displaystyle-\frac{\lambda}\log(1-p)\) |
生存関数 | \(\displaystyle\exp\left[ -\lambda x \right]\) |
逆生存関数 (確率\(p\)) |
\(\displaystyle-\frac{1}{\lambda}\log p\) |
危険度関数 | \(\displaystyle\lambda\) |
累積危険度関数 | \(\displaystyle\lambda x\) |
積率母関数 | \(\displaystyle\frac{\lambda}{\lambda-t}\ \ \ t< \lambda\) |
特性関数 | \(\displaystyle \frac{\lambda}{\lambda-it}\) |
キュムラント母関数 | \( \displaystyle-\log(1-\frac{t}{\lambda}) \) |
\(r\)次キュムラント | \( \displaystyle(r-1)!\left(\frac{1}{\lambda}\right)^{r},\ \ \ r>1 \) |
\(r\)次モーメント(原点まわり) | \( \displaystyle r!\left(\frac{1}{\lambda}\right)^{r}\) |
期待値 | \( \displaystyle\frac{1}{\lambda} \) |
分散 | \( \displaystyle\frac{1}{\lambda^{2}} \) |
平均偏差 | \( \displaystyle\frac{2}{e\lambda} \) |
中位数 | \( \displaystyle\frac{1}{\lambda}\log 2 \) |
モード | \( 0 \) |
歪度 |
\(2\) |
尖度 | \( 6 \) |
証明一覧
確率密度関数と累積分布関数
\(\lambda=0.2,\ 0.5,\ 1,\ 2,\ 3\)に対応する指数分布の確率密度関数、累積分布関数は次のようになります。
指数分布の無記憶性
幾何分布と同様に、指数分布も無記憶性という性質を持ちます。無記憶性とは、過去に起こった結果によって、事象が発生する確率は変化しないという性質になります。式で書くと
\mathrm{P}(X>n+m|X>m)=\mathrm{P}(X>n)
\end{align}
となります。
具体的には、ある製品を作る機械は100個に1個の割合で不良品が発見されるものだとします。今、この機械で100個製品を作成し、不良品が見つからなかったとします。このとき、不良品が見つかるまでにかかる製品の個数は、「不良品が見つかってから次の不良品が発見されるまでの製品の個数」は確率的に同じになります。
ソーシャルゲームのガチャで言うと、Sランキャラが出てきてから次にSランキャラが出るまでにかかる回数と、100回連続でハズレ続けてからSランキャラが出るまでにかかる回数は確率的に同じです。
まとめると、「今自分はハズレ続けているから、アタリを引く確率は高くなっている」という考え方は、指数分布や幾何分布では真っ向から否定することになります。
指数分布とガンマ分布
ガンマ分布に従う確率変数\(X\sim Gam(1,\lambda)\)は、指数分布\(X\sim Exp(\lambda)\)と一致します。このことは積率母関数を使って確認できます。ガンマ分布\(Gam(\alpha,\beta)\)の積率母関数は
M_{X}(t) = (1-\beta t)^{-\alpha}
\end{align}
となることから、\(\alpha=1,\beta=\frac{1}{\lambda}\)で積率母関数を書き換えると、
M_{X}(t) = \left(1-\frac{t}{\lambda} \right)^{-1}
\end{align}
が成り立ちます。この積率母関数はパラメータ\(\lambda\)の指数分布の積率母関数と一致することから、積率母関数の性質から指数分布に従うことがわかりあます。
指数分布とワイブル分布
ワイブル分布\(W(\phi,\gamma)\)について、\(\gamma=1\)の場合、パラメータ\(\phi\)の指数分布と一致し\(Exp(1/\phi)=W(\phi,1)\)となります。
逆にパラメータ\(\lambda\)の指数分布に従う確率変数\(X\sim Exp(\lambda)\)について、\(Y=\lambda(\frac{X}{\lambda})^{\frac{1}{\gamma}}\)と変換すると、\(Y\)はパラメータ\(1/\lambda,\gamma\)のワイブル分布\(Y\sim W(1/\lambda,\gamma)\)に従います。
指数分布と一様分布
パラメータ\(\lambda\)の指数分布に従う確率変数\(X\sim Exp(\lambda)\)と、区間\([0,1]\)の一様分布に従う確率変数\(Y\sim U(0,1)\)と次のような関係が成り立ちます。
X = -\frac{1}{\lambda}\log Y
\end{align}
指数分布とアーラン分布
\(X_{1},\cdots,X_{n}\)が互いに独立に、パラメータ\(\lambda\)の指数分布\(X_{i}\sim Exp(\lambda),\ i=1,\cdots,n\)に従うとき、この確率変数の和はパラメータ\(\alpha=n,\ \beta=\frac{1}{\lambda}\)のアーラン分布に従います。
指数分布の差
2つの独立なパラメータ\(\lambda\)の指数分布に従う確率変数\(X_{1},X_{2}\sim Exp(\lambda)\)の差は、パラメータ\(\frac{1}{\lambda}\)のラプラス分布に従います。
X_{1}-X_{2}\sim Laplace(1/\lambda)
\end{align}
指数分布とパレート分布
パラメータ\(\lambda\)の指数分布に従う、確率変数\(X\sim Exp(\lambda)\)を変数変換\(Y= ae^{x}\)はパラメータ\(a,\lambda\)のパレート分布に従います。
Y \sim Pareto\left(a,\lambda\right)
\end{align}
パラメータ推定(モーメント法・最尤法)
最尤法・モーメント法によるパラメータ推定は以下のようになります。
- 最尤法\begin{align}
\widehat{\lambda} = \bar{X}
\end{align} - モーメント法\begin{align}
\widehat{\lambda} = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}}
\end{align}