負の2項分布(negative binomial distribution)は離散型の確率分布で、ベルヌーイ試行を\(k\)回成功するまで試行を行うデータの確率分布です。成功確率\(p\)のベルヌーイ試行を\(k\)回成功するまでに失敗する回数を\(X\)とすると、\(X\)は負の2項分布に従うといいます。この記事では、負の2項分布の基本情報と主な性質についてまとめています。
負の2項分布の基本情報
※ 表は横にスクロールできます。
パラメータ | \(0 < p < 1\)(\(p\)は成功確率を表します。) \(0 < k\)(\(k\)は成功回数を表します。) |
確率変数の範囲 | \(0\leq x \) \(x\)は整数 |
累積分布関数 | \(\sum_{i=1}^{x}\ _{k+i-1}C_{k-1}p^{k}(1-p)^{i}\) |
確率関数 | \(_{k+x-1}C_{k-1}p^{k}(1-p)^{x}\) ただし\(k\)は整数 |
確率関数 |
\(\displaystyle\frac{\Gamma(k+x)}{\Gamma{(k)}x!}p^{k}(1-p)^{x}\) ただし\(k\)は整数 |
積率母関数 | \(\displaystyle\frac{p^{k}}{\{1-(1-p)e^{t}\}^{k}}\) |
階乗積率母関数 | \(\displaystyle\left( 1-\frac{(1-p)^{t}}{p} \right)^{-k}\) |
確率母関数 | \(\displaystyle\frac{p^{k}}{\{1-(1-p)t\}^{k}}\) |
特性関数 | \(\displaystyle\frac{p^{k}}{\{1-(1-p)e^{it}\}^{k}}\) |
キュムラント母関数 | \( k\log p-k\log\{1-(1-p)e^{t}\} \) |
モーメント(平均まわり) | \begin{align} 2次(分散) & \displaystyle \frac{ k(1-p) }{ p^{2} } \\ 3次 & \displaystyle \frac{ k(1-p)\left\{1+(1-p)\right\} }{ p^{2} } \\ 4次 & \displaystyle \frac{ k(1-p)\left\{ 1+4(1-p)+(1-p)^{2}+3k(1-p) \right\} }{ p^{4} } \end{align} |
期待値 | \( \displaystyle \frac{k(1-p)}{p} \) |
分散 | \(\displaystyle \frac{ k(1-p) }{ p^{2} } \) |
歪度 |
\(\displaystyle \frac{1+(1-p)}{\sqrt{k(1-p)}}\) |
尖度 | \( 3+\displaystyle\frac{6}{k}+\frac{p^{3}}{k(1-p)} \) |
証明一覧
確率関数
\(k=2\)で固定した場合の確率関数は次のようになります。
\(p=0.4\)で固定した場合の確率関数は次のようになります。
幾何分布と負の2項分布
\(k\)個の独立な幾何分布に従う確率変数の和は、\(k\)次の負の二項分布に従います。このことは、積率母関数を使って確認することができます。
\(X_{1},\cdots,X_{k}\sim Geo(p)\)とします。幾何分布の積率母関数は
M_{X_{i}}(t) = \frac{ pe^{t} }{ 1-(1-p)e^{t} }
\end{align}
でした。このことは<幾何分布の基本情報>をご覧ください。このとき、\(Y=X_{1}+\cdots+X_{k}-k\)について考えてみます。この\(Y\)は\(k\)回成功するまでに、失敗する回数を表します。このとき\(Y\)の積率母関数は
M_{Y}(t) &= \mathrm{E}\left[ e^{tY} \right] \\
&= \mathrm{E}\left[ e^{t(X_{1}+\cdots+X_{k}-k)} \right] \\
&= \prod_{i=1}^{k}\mathrm{E}\left[ e^{tX_{i}} \right]\cdot\mathrm{E}\left[ e^{-tk} \right] \\
&= \prod_{i=1}^{k}\frac{ pe^{t} }{ 1-(1-p)e^{t} }\cdot e^{-tk} \\
&= \frac{ p^{k}e^{tk} }{ \left\{1-(1-p)e^{t}\right\}^{k} }\cdot e^{-tk} \\
&= \frac{ p^{k} }{ \left\{1-(1-p)e^{t}\right\}^{k} } \\
\end{align}
となります。この積率母関数は負の2項分布の積率母関数と一致します。積率母関数の性質から、この\(Y\)は負の2項分布に従うことがわかります。積率母関数については下記の記事をご覧ください。
負の2項分布の再生性
確率変数\(X_{1},\cdots,X_{n}\)が互いに独立にパラメータ\(k_{i},p\)の負の二項分布に従っているとき、確率変数の和\(X_{1}+\cdots+X_{n}\)もパラメータ\(\sum_{i=1}^{n}k_{i},p\)の負の二項分布に従います。このことは、上の証明と同様、積率母関数を用いて証明できます。
負の2項分布とポアソン分布
\(\displaystyle\frac{k(1-p)}{p}=\lambda\)を一定に保ちながら、\(k\rightarrow\infty,\ p\rightarrow 1\)のとき、負の2項分布はパラメータ\(\lambda\)のポアソン分布に収束します。
パラメータの推定
・\(k\)が既知のとき(最尤法)
\widehat{p} = \frac{k}{k+\bar{X}}
\end{align}
不偏推定量は
\frac{k-\displaystyle\frac{1}{n}}{k+\bar{X}-\displaystyle\frac{1}{n}}
\end{align}
となります。
・\(k\)が未知のとき(モーメント法)
\widehat{p} &= \frac{\bar{X}}{\widehat{\sigma}^{2}} \\
\widehat{k} &= \frac{\bar{X}^{2}}{\widehat{\sigma}^{2}-\bar{X}}
\end{align}
ただし、
\bar{X} = \frac{1}{n}\sum_{i=1}^{n}X_{i},\ \ \ \widehat{\sigma}^{2} = \frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}
\end{align}
です。
負の2項分布と関連深い分布
負の2項分布と関連深い分布を図・表でまとめています。各分布の詳しい情報は表の中のリンクからお願いします。
ベルヌーイ分布 | ベルヌーイ試行を1回行うときの分布 |
カテゴリ分布 | 1回の試行で\(k\)通りのパターンの中からどれかが得られる可能性がある試行を表す分布 |
2項分布 | \(n\)回のベルヌーイ試行で\(x\)回成功するときの分布 |
幾何分布 | ベルヌーイ試行を複数回行う上で、初めて成功するまでの 試行回数を表す分布 |
超幾何分布 | ベルヌーイ試行を複数回行っていく上で、その都度成功確率が 変化する分布(有限個のアタリくじなど) |
負の2項分布 | ベルヌーイ試行を複数回行う上で、\(k\)回成功するまでの 失敗する回数を表す分布(\(k=1\)の場合、幾何分布になります) |
多項分布 | 成功・失敗の2種類だけでなく、試行の結果が 複数個ある場合の分布を表します |
ポアソン分布 | 成功確率が極端に小さく(つまり滅多に起こらない)、 試行回数が極端に大きい場合の分布 |