確率分布

カイ2乗分布

 カイ2乗分布(chi square distribution)は、連続型の確率分布です。多くの書籍では、標準正規分布の平方和で定義されます。カイ2乗分布は標本推定などにおいて、多くの推定量で出てくるものになります。カイ2乗分布から定義される分布もあるので、統計学を学ぶ上で是非とも抑えておきたい分布となります。
 期待値が\(0\)でない場合は非心カイ2乗分布、多変量正規分布の場合はウィシャート分布となります。

 互いに独立に標準正規分布に従う確率変数を\(Y_{1},\cdots,Y_{n}\sim N(0,1)\)とします。このとき\(Y_{1},\cdots,Y_{n}\)の平方和は自由度\(n\)のカイ2乗分布に従うといい、

\begin{align}X = \sum_{i=1}^{n}Y_{i}^{2} \sim \chi^{2}(n)\end{align}
と表されます。

カイ2乗分布の基本情報

※ 表は横にスクロールできます。

パラメータ \(n\)
カイ2乗分布の自由度とも言われます。
確率変数の範囲 \(0\leq x \)
確率密度関数 \(\displaystyle \frac{ 1 }{ 2^{\frac{1}{2}n}\Gamma\left( \frac{n}{2} \right) }e^{-\frac{x}{2}}x^{\frac{n}{2}-1} \)
累積分布関数 \(\displaystyle \frac{\Gamma_{\frac{x}{2}}\left( \frac{n}{2} \right)}{\Gamma\left( \frac{n}{2} \right)}\)
ただし、\(\Gamma_{x}\left( n \right)\)は不完全ガンマ関数であり次式で定義されます。
\(\displaystyle \Gamma_{x}(n)=\int_{0}^{x}e^{-t}t^{n-1}dt\)
積率母関数 \(\displaystyle (1-2t)^{-\frac{n}{2}},\ \ \ t<\frac{1}{2} \)
特性関数 \(\displaystyle (1-2it)^{-\frac{n}{2}} \)
キュムラント母関数 \(\displaystyle \frac{n}{2}\log(1-2t)\)
\(r\)次キュムラント \(\displaystyle 2^{r-1}n(r-1)!,\ \ \ r\geq 0\)
\(r\)次モーメント
(原点まわり)
\(\displaystyle 2^{r}\prod_{i=0}^{r-1}\left( \frac{n}{2}+i \right) = \frac{2^{r}\Gamma\left( \frac{n}{2}+r \right)}{\Gamma\left( \frac{n}{2} \right)}\)
期待値 \( \displaystyle n \)
分散 \( \displaystyle 2n \)
中位数

\( \displaystyle n-\frac{2}{3} \)(十分に大きな\(n\)に対して近似的に表したものです)

モード \( \displaystyle n-2,\ \ \ n\geq 2 \)
平均偏差 \( \displaystyle \frac{e^{-\frac{n}{2}}n^{\frac{n}{2}}}{2^{\frac{n}{2}-1}\Gamma\left( \frac{n}{2} \right)} \)
歪度

\(\displaystyle \sqrt{\frac{8}{n}}\)

尖度 \( \displaystyle 3+\frac{12}{n}\)

証明一覧

 

確率密度関数と累積分布関数

様々な自由度に対するカイ2乗分布の確率密度関数と累積分布関数です。

カイ2乗分布の再生性

 カイ2乗分布に従う互いに独立な確率変数\(X_{i}\sim \chi^{2}(n_{i})\)(\(i=1,\cdots,n\))に対して、以下のようなことが成り立ちます。

\begin{align}
\sum_{i=1}^{n}X_{i} \sim \chi^{2}\left( \sum_{i=1}^{n}n_{i}\right)
\end{align}
証明はとても簡単です。確率変数\(X_{i}\)の積率母関数を\(M_{X_{i}}(t)\)とすると、
\begin{align}
M_{\sum_{i=1}^{n}X_{i}}(t) &= \mathrm{E}[\exp[t(X_{1}+\cdots+X_{n})]] \\
&= \prod_{i=1}^{n}\mathrm{E}[\exp[tX_{i}]] \\
&= \prod_{i=1}^{n}M_{X_{i}}(t) \\
&= \prod_{i=1}^{n}(1-2t)^{-\frac{n_{i}}{2}} \\
&= (1-2t)^{-\frac{\sum_{i=1}^{n}n_{i}}{2}}
\end{align}
が成り立つことから、<積率母関数の性質>より、\(X_{1}+\cdots+X_{n}\)は自由度\(n_{1}+\cdots+n_{n}\)のカイ2乗分布に従うことがわかります。

カイ2乗分布とガンマ分布

 ガンマ分布におけるパラメータを\(\alpha=n/2,\ \beta=n/2\)とすると、自由度\(n\)のカイ2乗分布と一致します。

カイ2乗分布と\(t\)分布

 互いに独立な確率変数\(Z\sim N(0,1)\)と\(V\sim \chi^{2}(n)\)を用いて、次のような関係が成り立ちます。

\begin{align}
\frac{Z}{\sqrt{\frac{V}{n}}} \sim t(n)
\end{align}

カイ2乗分布と\(F\)分布

 互いに独立な確率変数\(U\sim \chi^{2}(n_{1})\)と\(V\sim \chi^{2}(n_{2})\)を用いて、次のような関係が成り立ちます。

\begin{align}
\frac{\frac{U}{n_{1}}}{\frac{V}{n_{2}}} \sim F(n_{1},\ n_{2})
\end{align}

コクランの定理とカイ2乗分布

コクランの定理
 期待値が\(0\)となる互いに独立に正規分布に従う確率変数\(x_{i}\sim N(0,\sigma^{2})\)(\(i=1,\cdots,n\))について、確率変数をベクトルでまとめたもの\(x={}^{T}\!(x_{1}\ \cdots\ x_{n})\)について考えます(この確率変数\(x\)は多変量正規分布\(N_{n}(0,\sigma^{2}I_{n})\)と同値です)。
 さらに行列\(A_{i}\)(\(i=1,\cdots,k\))を\(n\)次の対称行列で
\begin{align}A_{1}+\cdots+A_{k} = I_{n}\end{align}
を満たすものとします。
 \(\mathrm{rank}(A_{i})=n_{i}\)と書くとき、
「\(Q_{i}=\ {}^{T}\!xA_{i}x\)が互いに独立にカイ2乗分布\(Q_{i}/\sigma^{2}\sim \chi^{2}(n_{i})\)に従う」
ということと必要十分条件は
「\(n=\sum_{i=1}^{k}n_{i}\)が成り立つ」
ということになります。

 コクランの定理は線形回帰モデルなどで、使用されます。コクランの定理の証明は以下のリンクの記事で行っています(証明はもう少し一般化したものでしています。一般化したコクランの定理は<ウィシャート分布><コクランの定理>で紹介しています)。

カイ2乗分布と関連深い確率分布

-確率分布
-, ,

© 2024 初心者からはじめる統計学 Powered by AFFINGER5