学習レベル:大学生 難易度:★★☆☆☆
この記事では多項分布の期待値・分散を証明付きで解説していきます。期待値・分散の求め方が分からない方は是非お読みください。その他の多項分布の基本情報は<多項分布>の記事をお読みください。
多項分布の期待値・分散
期待値と分散
\(1\)回の試行で\(k\)通りのパターン\(A_{1},\cdots,A_{k}\)が得られる可能性があり、それぞれのパターンが得られる確率を\(p_{1},\cdots,p_{k}\)とします。このとき\(n\)回の試行によるパターン\(A_{i}\)が得たれる回数\(X_{i}\)(多項分布)の期待値・分散は次のようになります。
\begin{align}
\mathrm{E}[X_{i}]=np_{i},\ \ \ \mathrm{Var}[X_{i}]=np_{i}(1-p_{i})
\end{align}
期待値・分散を求める際には<期待値の定義>および<分散の定義>を使用するので、覚えていない方は証明を読む前に一度、目を通しておいてください。
証明
\(X_{1},\cdots,X_{k}\)の同時確率関数は
\begin{align}
f(x_{1},\cdots,x_{k})= n!\displaystyle\prod_{i=1}^{k}\left( \frac{p_{i}^{x_{i}}}{x_{i}!} \right)
\end{align}
f(x_{1},\cdots,x_{k})= n!\displaystyle\prod_{i=1}^{k}\left( \frac{p_{i}^{x_{i}}}{x_{i}!} \right)
\end{align}
となります。このことは<多項分布の基本情報>をお読みください。
まず、期待値を求めていきます。期待値の定義から
\begin{align}
\mathrm{E}[X_{i}] &= \sum_{j=1}^{k}x_{i}f(x_{1},\cdots,x_{k}) \\
&= \sum_{j=1}^{k}x_{i}n!\displaystyle\prod_{i=1}^{k}\left( \frac{p_{i}^{x_{i}}}{x_{i}!} \right) \\
&= \sum_{j=1}^{k}x_{i}n! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots x_{k}!} \\
&= np_{i}\sum_{j=1}^{k}x_{i}(n-1)! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{i}^{(x_{i}-1)}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots(x_{i}-1)!\cdots x_{k}!} \\
&= np_{i}
\end{align}
\mathrm{E}[X_{i}] &= \sum_{j=1}^{k}x_{i}f(x_{1},\cdots,x_{k}) \\
&= \sum_{j=1}^{k}x_{i}n!\displaystyle\prod_{i=1}^{k}\left( \frac{p_{i}^{x_{i}}}{x_{i}!} \right) \\
&= \sum_{j=1}^{k}x_{i}n! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots x_{k}!} \\
&= np_{i}\sum_{j=1}^{k}x_{i}(n-1)! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{i}^{(x_{i}-1)}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots(x_{i}-1)!\cdots x_{k}!} \\
&= np_{i}
\end{align}
となります。ここで最後の行の変形は、総和の中について見てみると、パラメータが異なる多項分布の確率関数になっているので、確率関数の総和が\(1\)となることを用いました。このことは分散を求めるときにも使用します。
まず<分散の定義>の記事から分散は
\begin{align}
\mathrm{Var}[X] &= \mathrm{E}[X^{2}]-\mathrm{E}[X]^{2}
\end{align}
\mathrm{Var}[X] &= \mathrm{E}[X^{2}]-\mathrm{E}[X]^{2}
\end{align}
と表すことができるので、\(\mathrm{E}[X_{i}^{2}]\)を求めればよいことがわかります。よって
\begin{align}
\mathrm{E}[X_{i}^{2}] &= \sum_{j=1}^{k}x_{i}^{2}f(x_{1},\cdots,x_{k}) \\
&= \sum_{j=1}^{k}\{x_{i}(x_{i}-1)+x_{i}\}n!\displaystyle\prod_{i=1}^{k}\left( \frac{p_{i}^{x_{i}}}{x_{i}!} \right) \\
&= \sum_{j=1}^{k}x_{i}(x_{i}-1)n! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots x_{k}!}+ \sum_{j=1}^{k}x_{i}n!\displaystyle\prod_{i=1}^{k}\left( \frac{p_{i}^{x_{i}}}{x_{i}!} \right) \\
&= \sum_{j=1}^{k}x_{i}(x_{i}-1)n! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots x_{k}!}+ np_{i} \\
&= n(n-1)p_{i}^{2} \sum_{j=1}^{k}(n-2)! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{i}^{(x_{i}-2)}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots (x_{i}-2)!\cdots x_{k}!} +np_{i}\\
&= n(n-1)p_{i}^{2} + np_{i}
\end{align}
\mathrm{E}[X_{i}^{2}] &= \sum_{j=1}^{k}x_{i}^{2}f(x_{1},\cdots,x_{k}) \\
&= \sum_{j=1}^{k}\{x_{i}(x_{i}-1)+x_{i}\}n!\displaystyle\prod_{i=1}^{k}\left( \frac{p_{i}^{x_{i}}}{x_{i}!} \right) \\
&= \sum_{j=1}^{k}x_{i}(x_{i}-1)n! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots x_{k}!}+ \sum_{j=1}^{k}x_{i}n!\displaystyle\prod_{i=1}^{k}\left( \frac{p_{i}^{x_{i}}}{x_{i}!} \right) \\
&= \sum_{j=1}^{k}x_{i}(x_{i}-1)n! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots x_{k}!}+ np_{i} \\
&= n(n-1)p_{i}^{2} \sum_{j=1}^{k}(n-2)! \frac{p_{1}^{x_{1}}p_{2}^{x_{2}}\cdots p_{i}^{(x_{i}-2)}\cdots p_{k}^{x_{k}}}{x_{1}!x_{2}!\cdots (x_{i}-2)!\cdots x_{k}!} +np_{i}\\
&= n(n-1)p_{i}^{2} + np_{i}
\end{align}
となることから求めたい分散を導くことができます。
□