正規分布に従う確率変数を行列の形でまとめたものは、行列変量正規分布(matrix normal distribution)に従います。ただし、この確率変数について
X=\left(\begin{array}{ccc}
X_{11} & \cdots & X_{1p} \\
\vdots & \ddots & \vdots \\
X_{n1} & \cdots & X_{np}
\end{array}\right)
\end{align}
行列変量正規分布に従う確率変数は、記号\(X\sim N_{n\times p}(M,\ U,\ V)\)で表されます。ただし、\(n\times p\)の行列\(M\)は確率変数\(X\)の期待値、\(n\times n\)の行列\(U\)は正定値行列、\(p\times p\)の行列\(V\)は正定値行列を表します。
行列変量正規分布に従う確率変数\(X\sim N_{n\times p}(M,\ U,\ V)\)について、\(p=1\)のとき確率変数\(X\)は分散共分散行列\(U\)になる多変量正規分布\(X\sim N_{n}(M,U)\)に従います。さらに\(p=1,\ n=1\)のとき行列変量正規分布は正規分布に従います。
※正規分布、多変量正規分布については以下のリンクからお願いします。
目次
多変量正規分布の基本情報
※ 表は横にスクロールできます。
パラメータ | \(M,\ \ \ 0 < U,\ V\) ただし、\(U,\ V >0\)は\(U,\ V\)が正定値行列を表します。 |
確率変数の範囲 | \(-\infty< x_{ij} <\infty \),(\(i=1,\cdots,n,\ \ j=1,\cdots,p\)) |
確率密度関数 | \(\displaystyle \frac{1}{(2\pi)^{\frac{1}{2}np}|U|^{\frac{1}{2}p}|V|^{\frac{1}{2}n}}\exp\left[ -\frac{1}{2}\mathrm{tr} \left\{ U^{-1}(X-M)V^{-1}\,{}^{T}\!(X-M) \right\} \right] \) |
積率母関数 | \(\displaystyle \exp\left[ \mathrm{tr}\left( {}^{T}\!MT \right)+\frac{1}{2}\mathrm{tr}\left( {}^{T}\!TUTV \right) \right] \) |
期待値 | \( \displaystyle M \) |
分散共分散行列 (確率変数をベクトル展開したもの) |
\( \displaystyle U\otimes V \) 確率変数\(X\)の列ベクトルをひとつに並べたベクトルの 分散共分散行列を表します。 |
記号の定義
- クロネッカー積\(\otimes\)
\(p\times q\)の行列\(A\)と、\(s\times t\)の行列\(B\)のクロネッカー積\(A\otimes B\)は次のように定義します。\begin{align}
(A\otimes B)_{ij} = (a_{ij}B)_{ij},\ \ \ (i=1,\cdots,p,\ \ \ j=1,\cdots,q)
\end{align} - ベクトル展開\(\mathrm{vec}\)
行列\(X=(x_{1},\cdots,x_{n})\)(\(x_{1},\cdots,x_{n}\)は行列\(X\)の列ベクトルを表します)について、ベクトル展開\(\mathrm{vec}(X)\)とは次のように定義します。\begin{align}
\mathrm{vec}(X) = \left(\begin{array}{c}
x_{1} \\
\vdots \\
x_{n}
\end{array}\right)
\end{align}
行列変量正規分布と多変量正規分布
証明
確率密度関数を書き換えていきます。まず指数部分について計算すると
-\frac{1}{2}\mathrm{tr}\left[ U^{-1}(X-M)V^{-1}\,{}^{T}\!(X-M) \right] &= -\frac{1}{2}\mathrm{vec}\,{}^{T}\!(X-M)\mathrm{vec}\left( U^{-1}(X-M)V^{-1} \right) \\
&= -\frac{1}{2}\mathrm{vec}\,{}^{T}\!(X-M)\left( U^{-1}\otimes V^{-1} \right)\mathrm{vec}\left( X-M)V \right) \\
&= -\frac{1}{2}\,{}^{T}\!\left\{\mathrm{vec}(X)-\mathrm{vec}(M)\right\}\left( U^{-1}\otimes V^{-1} \right)\left\{\mathrm{vec}(X)-\mathrm{vec}(M)\right\}) \\
\end{align}
|U\otimes V| &= |U|^{p}|V|^{n}
\end{align}
\frac{1}{(2\pi)^{\frac{1}{2}np}|U|^{\frac{1}{2}p}|V|^{\frac{1}{2}n}}\exp\left[ -\frac{1}{2}\mathrm{tr} \left\{ U^{-1}(X-M)V^{-1}\,{}^{T}!(X-M) \right\} \right] &= \frac{1}{(2\pi)^{\frac{1}{2}np}|U\otimes V|^{\frac{1}{2}}}\exp\left[ -\frac{1}{2}\,{}^{T}\!\left\{\mathrm{vec}(X)-\mathrm{vec}(M)\right\}\left( U^{-1}\otimes V^{-1} \right)\left\{\mathrm{vec}(X)-\mathrm{vec}(M)\right\} \right]
\end{align}
となることから、多変量正規分布と一致することがわかります。
□
※多変量正規分布については以下のリンクからお願いします。
行列変量正規分布に従う確率変数の線形関数
行列変量正規分布とウィシャート分布
行列変量正規分布に従う確率変数\(X_{i}\sim N_{n\times p}(O,\ I_{n},\ V)\)とします。つまり、期待値\(O\)の任意の行ベクトル同士は互いに独立になっている行列変量正規分布について考えます。このとき、次のような関係が成り立ちます。
{}^{T}\!XX \sim W_{p}(n,\ V)
\end{align}
条件付き行列変量正規分布
\(n\times p\)の行列変量正規分布に従う確率変数を\(X = (X_{1}\ X_{2})\sim N_{p}(M,\ U,\ V)\)と分割します。ただし、\(X_{1}\)は\(n\times p_{1}\)の確率変数、\(X_{2}\)は\(n\times p_{2}\)の確率変数であり\(p_{1}+p_{2}=p\)が成り立っています。
\(X\)が行列正規分布に従っていることから、\(X_{1}\)と\(X_{2}\)も行列正規分布に従います。よって
X_{1}\sim N_{n\times p_{1}}(M_{1},\ U,\ V_{11}),\ \ X_{2} \sim N_{n\times p_{2}}(M_{2},\ U,\ V_{22})
\end{align}
M=\left( \begin{array}{cc}
M_{1} & M_{2}
\end{array}\right), \ \ \ \ V = \left( \begin{array}{cc}
V_{11} & V_{12}\\
V_{21} & V_{22}
\end{array}\right),\ \ \ \ V_{ij}はp_{i}\times p_{j}の行列です
\end{align}
このとき、次のような関係が成り立ちます。
この条件付き行列変量正規分布について、\(n=1)\として転置をとったものは条件付き多変量正規分布と一致します。
証明は別ページで紹介します(計算が大変なのである程度の計算知識が必要になります)。以下のリンクからどうぞ。
\mathrm{E}[X_{1}|X_{2}] &= M_{1}+(X_{2}-M_{2})V_{22}^{-1}V_{21} \\
\mathrm{Var}[X_{1}|X_{2}] &= U\otimes(V_{11}-V_{12}V_{22}^{-1}V_{21})
\end{align}
となります。
行列変量正規分布と関連深い確率分布
.png)