正規分布に従う確率変数をベクトルの形でまとめたものは、多変量正規分布(multivariate normal distribution)に従います。具体的には正規分布に従う確率変数\(X_{i}\sim N(\mu_{i},\sigma_{i}^{2})\)(\(i=1,\cdots,p\))を、ひとつのベクトル\(X={}^{T}(X_{1},\cdots,X_{p})\)にまとめたものが、多変量正規分布に従います。このとき、\(X_{i},X_{j}\)(\(i\neq j\))は互いに独立でなくても構いません。そこで、\(X_{i}\)と\(X_{j}\)(\(i\neq j\))の共分散を\(\sigma_{ij}\)とおきます。多変量正規分布のパラメータは期待値\(\mu_{i}\)、分散\(\sigma_{i}^{2}\)、共分散\(\sigma_{ij}\)(\(i\neq j\))をまとめた
\mu = \left(\begin{array}{c}
\mu_{1} \\
\vdots \\
\mu_{p}
\end{array}\right),\ \ \ \ \Sigma=\left(\begin{array}{cccc}
\sigma_{1}^{2} & \sigma_{12} & \cdots & \sigma_{1p} \\
\sigma_{21} & \sigma_{2}^{2} & \cdots & \sigma_{2p} \\
\vdots & \vdots & \ddots & \vdots \\
\sigma_{p1} & \sigma_{p2} & \cdots & \sigma_{p}^{2}
\end{array}\right)
\end{align}
を用いて表されます。多変量正規分布に従う\(p\)次変量確率変数は記号で\(X\sim N_{p}(\mu,\Sigma)\)と表されます。特に\(p=1\)のとき、多変量正規分布は正規分布と同じものになります。
※正規分布については以下のリンクからお願いします。
目次
多変量正規分布の基本情報
※ 表は横にスクロールできます。
パラメータ | \(\mu,\ \ \ 0 < \Sigma\) ただし、\(\Sigma >0\)は\(\Sigma\)が正定値行列を表します。 |
確率変数の範囲 | \(-\infty< x_{i} <\infty \),(\(i=1,\cdots,p\)) |
確率密度関数 | \(\displaystyle \frac{1}{\sqrt{(2\pi)^{p}|\Sigma|}}\exp\left[ -\frac{1}{2}{}^{T}\!(x-\mu)\Sigma^{-1}(x-\mu) \right] \) |
積率母関数 | \(\displaystyle \exp\left[ {}^{T}\!\mu t+\frac{1}{2}{}^{T}\!t\Sigma t \right] \) |
特性関数 | \(\displaystyle \exp\left[ i{}^{T}\!\mu t-\frac{1}{2}{}^{T}\!t\Sigma t \right] \) |
キュムラント母関数 | \(\displaystyle {}^{T}\!\mu t+\frac{1}{2}{}^{T}\!t\Sigma t\) |
\(r\)次キュムラント | \(\kappa_{r}=0(r>2)\) |
期待値 | \( \displaystyle \mu \) |
分散共分散行列 | \( \displaystyle \Sigma \) |
多変量正規分布と正規分布
\(p\)次の多変量正規分布に従う確率変数\(X\sim N_{p}(\mu,\Sigma)\)について、\(p=1\)としたときの分布\(X\sim N(\mu,\sigma^{2})\)は正規分布と一致します。このことは、多変量正規分布の確率密度関数で\(p=1\)とすると
f(x) &= \frac{1}{\sqrt{2\pi\sigma^{2}}}\exp\left[ -\frac{1}{2\sigma^{2}}(x-\mu)^{2} \right]
\end{align}
となることから、正規分布と一致することが確認できます。
多変量正規分布と確率変数の独立性
\(p\)次の多変量正規分布に従う確率変数\(X\sim N_{p}(\mu,\Sigma)\)について、もし分散共分散行列にあたる\(\Sigma\)が対角行列
\Sigma &= \left(\begin{array}{cccc}
\sigma_{1}^{2} & 0 & \cdots & 0 \\
0 & \sigma_{2}^{2} & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & \sigma_{p}^{2}
\end{array}\right)
\end{align}
となっているとき、確率変数\(X_{i}\)と\(X_{j}\)(\(i\neq j\))の共分散が\(0\)となっているので、共分散の性質から\(X_{i}\)と\(X_{j}\)(\(i\neq j\))は互いに独立となることを意味します。
※共分散については以下のリンクからお願いします。
多変量正規分布に従う確率変数の線形関数
- \(p\)次の多変量正規分布に従う確率変数\(X\sim N_{p}(\mu,\Sigma)\)について、
行列\(A\)を\(p\times p\)の非特異行列、ベクトル\(b\)を\(p\)次のベクトルとすると、\begin{align}が成り立ちます。
Y = AX+b \sim N_{p}(A\mu+b,A\Sigma\ {}^{T}\!A)
\end{align}
- \(p\)次の多変量正規分布に従う確率変数\(X\sim N_{p}(\mu,\Sigma)\)について、行列\(A\)を\(q\times p\)の\(\mathrm{rank}(A)=q\leq p\)が成り立つとき、\begin{align}となります。
Z = AX \sim N_{q}(A\mu,A\Sigma\ {}^{T}\!A)
\end{align}
多変量正規分布とウィシャート分布
\(p\)次の多変量正規分布に従う確率変数\(X_{i}\sim N_{p}(0,\Sigma)\)(\(i=1,\cdots,n\))について、それぞれの確率変数が互いに独立だった場合
X_{1}\ {}^{T}X_{1} + \cdots + X_{n}\ {}^{T}X_{n} \sim W_{p}(n,\Sigma)
\end{align}
期待値\(0\)でない場合の確率変数\(X_{i}\sim N_{p}(\mu_{i},\Sigma)\)(\(i=1,\cdots,n\))でも同様のことが成り立ち、
X_{1}\ {}^{T}X_{1} + \cdots + X_{n}\ {}^{T}X_{n} \sim W_{p}\left(n\ ,\ \Sigma\ ;\ \sum_{i=1}^{n}\mu_{i}\ {}^{T}\mu_{i}\right)
\end{align}
となります。ただし、\( W_{p}\left(n\ ,\ \Sigma\ ;\ \sum_{i=1}^{n}\mu_{i}\ {}^{T}\mu_{i}\right) \)は非心ウィシャート分布を表します。
条件付き正規分布
\(p\)次の多変量正規分布に従う確率変数を\(X = {}^{T}(X_{1}\ X_{2})\sim N_{p}(\mu,\Sigma)\)と分割します。ただし、\(X_{1}\)は\(p_{1}\)次の確率変数、\(X_{2}\)は\(p_{2}\)次の確率変数であり\(p_{1}+p_{2}=p\)が成り立っています。
\(X\)が多変量正規分布に従っていることから、\(X_{1}\)と\(X_{2}\)も多変量正規分布に従います。よって
X_{1}\sim N_{p_{1}}(\mu_{1},\Sigma_{11}),\ \ X_{2} \sim N_{p_{2}}(\mu_{2},\Sigma_{22})
\end{align}
\mu = \left( \begin{array}{c}
\mu_{1} \\
\mu_{2}
\end{array}\right), \Sigma = \left( \begin{array}{cc}
\Sigma_{11} & \Sigma_{12}\\
\Sigma_{21} & \Sigma_{22}
\end{array}\right)
\end{align}
このとき、\(X_{1}\)が与えられたとき、\(X_{2}\)の条件付き分布も正規分布に従い、
X_{2}\,|\,X_{1} \sim N_{p_{2}} \left( \mu_{2}+\Sigma_{21}\Sigma_{11}^{-1}(x_{2}-\mu_{2}),\ \Sigma_{22}-\Sigma_{21}\Sigma_{11}^{-1}\Sigma_{12} \right)
\end{align}
となります。つまり、条件付き期待値、条件付き分散が
\mathrm{E}[X_{2}|X_{1}] &= \mu_{2}+\Sigma_{21}\Sigma_{11}^{-1}(x_{2}-\mu_{2}) \\
\mathrm{Var}[X_{2}|X_{1}] &= \Sigma_{22}-\Sigma_{21}\Sigma_{11}^{-1}\Sigma_{12}
\end{align}
となる、条件付き正規分布に従います。
\mathrm{E}[X_{1}|X_{2}] &= \mu_{1}+\Sigma_{12}\Sigma_{22}^{-1}(x_{1}-\mu_{1}) \\
\mathrm{Var}[X_{1}|X_{2}] &= \Sigma_{11}-\Sigma_{12}\Sigma_{22}^{-1}\Sigma_{21}
\end{align}
となります。
証明は行列変量正規分布で行います(行列変量正規分布の証明のなかで、\(n=1\)で置き換えるとこの証明は完了します)。