カイ2乗分布(chi square distribution)は、連続型の確率分布です。多くの書籍では、標準正規分布の平方和で定義されます。カイ2乗分布は標本推定などにおいて、多くの推定量で出てくるものになります。カイ2乗分布から定義される分布もあるので、統計学を学ぶ上で是非とも抑えておきたい分布となります。
期待値が\(0\)でない場合は非心カイ2乗分布、多変量正規分布の場合はウィシャート分布となります。
互いに独立に標準正規分布に従う確率変数を\(Y_{1},\cdots,Y_{n}\sim N(0,1)\)とします。このとき\(Y_{1},\cdots,Y_{n}\)の平方和は自由度\(n\)のカイ2乗分布に従うといい、
目次
カイ2乗分布の基本情報
※ 表は横にスクロールできます。
パラメータ | \(n\) カイ2乗分布の自由度とも言われます。 |
確率変数の範囲 | \(0\leq x \) |
確率密度関数 | \(\displaystyle \frac{ 1 }{ 2^{\frac{1}{2}n}\Gamma\left( \frac{n}{2} \right) }e^{-\frac{x}{2}}x^{\frac{n}{2}-1} \) |
累積分布関数 | \(\displaystyle \frac{\Gamma_{\frac{x}{2}}\left( \frac{n}{2} \right)}{\Gamma\left( \frac{n}{2} \right)}\) ただし、\(\Gamma_{x}\left( n \right)\)は不完全ガンマ関数であり次式で定義されます。 \(\displaystyle \Gamma_{x}(n)=\int_{0}^{x}e^{-t}t^{n-1}dt\) |
積率母関数 | \(\displaystyle (1-2t)^{-\frac{n}{2}},\ \ \ t<\frac{1}{2} \) |
特性関数 | \(\displaystyle (1-2it)^{-\frac{n}{2}} \) |
キュムラント母関数 | \(\displaystyle \frac{n}{2}\log(1-2t)\) |
\(r\)次キュムラント | \(\displaystyle 2^{r-1}n(r-1)!,\ \ \ r\geq 0\) |
\(r\)次モーメント (原点まわり) |
\(\displaystyle 2^{r}\prod_{i=0}^{r-1}\left( \frac{n}{2}+i \right) = \frac{2^{r}\Gamma\left( \frac{n}{2}+r \right)}{\Gamma\left( \frac{n}{2} \right)}\) |
期待値 | \( \displaystyle n \) |
分散 | \( \displaystyle 2n \) |
中位数 |
\( \displaystyle n-\frac{2}{3} \)(十分に大きな\(n\)に対して近似的に表したものです) |
モード | \( \displaystyle n-2,\ \ \ n\geq 2 \) |
平均偏差 | \( \displaystyle \frac{e^{-\frac{n}{2}}n^{\frac{n}{2}}}{2^{\frac{n}{2}-1}\Gamma\left( \frac{n}{2} \right)} \) |
歪度 |
\(\displaystyle \sqrt{\frac{8}{n}}\) |
尖度 | \( \displaystyle 3+\frac{12}{n}\) |
証明一覧
確率密度関数と累積分布関数
様々な自由度に対するカイ2乗分布の確率密度関数と累積分布関数です。
カイ2乗分布の再生性
カイ2乗分布に従う互いに独立な確率変数\(X_{i}\sim \chi^{2}(n_{i})\)(\(i=1,\cdots,n\))に対して、以下のようなことが成り立ちます。
\sum_{i=1}^{n}X_{i} \sim \chi^{2}\left( \sum_{i=1}^{n}n_{i}\right)
\end{align}
M_{\sum_{i=1}^{n}X_{i}}(t) &= \mathrm{E}[\exp[t(X_{1}+\cdots+X_{n})]] \\
&= \prod_{i=1}^{n}\mathrm{E}[\exp[tX_{i}]] \\
&= \prod_{i=1}^{n}M_{X_{i}}(t) \\
&= \prod_{i=1}^{n}(1-2t)^{-\frac{n_{i}}{2}} \\
&= (1-2t)^{-\frac{\sum_{i=1}^{n}n_{i}}{2}}
\end{align}
カイ2乗分布とガンマ分布
ガンマ分布におけるパラメータを\(\alpha=n/2,\ \beta=n/2\)とすると、自由度\(n\)のカイ2乗分布と一致します。
カイ2乗分布と\(t\)分布
互いに独立な確率変数\(Z\sim N(0,1)\)と\(V\sim \chi^{2}(n)\)を用いて、次のような関係が成り立ちます。
\frac{Z}{\sqrt{\frac{V}{n}}} \sim t(n)
\end{align}
カイ2乗分布と\(F\)分布
互いに独立な確率変数\(U\sim \chi^{2}(n_{1})\)と\(V\sim \chi^{2}(n_{2})\)を用いて、次のような関係が成り立ちます。
\frac{\frac{U}{n_{1}}}{\frac{V}{n_{2}}} \sim F(n_{1},\ n_{2})
\end{align}
コクランの定理とカイ2乗分布
さらに行列\(A_{i}\)(\(i=1,\cdots,k\))を\(n\)次の対称行列で
\(\mathrm{rank}(A_{i})=n_{i}\)と書くとき、
「\(Q_{i}=\ {}^{T}\!xA_{i}x\)が互いに独立にカイ2乗分布\(Q_{i}/\sigma^{2}\sim \chi^{2}(n_{i})\)に従う」
ということと必要十分条件は
「\(n=\sum_{i=1}^{k}n_{i}\)が成り立つ」
ということになります。
コクランの定理は線形回帰モデルなどで、使用されます。コクランの定理の証明は以下のリンクの記事で行っています(証明はもう少し一般化したものでしています。一般化したコクランの定理は<ウィシャート分布><コクランの定理>で紹介しています)。