行列変量正規分布

　正規分布に従う確率変数を行列の形でまとめたものは、行列変量正規分布（matrix normal distribution）に従います。ただし、この確率変数について

\begin{align}
X=\left(\begin{array}{ccc}
X_{11} & \cdots & X_{1p} \\
\vdots & \ddots & \vdots \\
X_{n1} & \cdots & X_{np}
\end{array}\right)
\end{align}

としたとき、任意の列ベクトル\(x_{i} = \,{}^{t}\!(x_{1i},\cdots,x_{ni})\)（\(i=1,\cdots,p\)）の分散共分散行列は\(U\)、任意の行ベクトル\(x_{j} = \,{}^{t}\!(x_{j1},\cdots,x_{jp})\)（\(j=1,\cdots,n\)）の分散共分散行列は\(V\)で与えることができるものとします。

　行列変量正規分布に従う確率変数は、記号\(X\sim N_{n\times p}(M,\ U,\ V)\)で表されます。ただし、\(n\times p\)の行列\(M\)は確率変数\(X\)の期待値、\(n\times n\)の行列\(U\)は正定値行列、\(p\times p\)の行列\(V\)は正定値行列を表します。

　行列変量正規分布に従う確率変数\(X\sim N_{n\times p}(M,\ U,\ V)\)について、\(p=1\)のとき確率変数\(X\)は分散共分散行列\(U\)になる多変量正規分布\(X\sim N_{n}(M,U)\)に従います。さらに\(p=1,\ n=1\)のとき行列変量正規分布は正規分布に従います。

※正規分布、多変量正規分布については以下のリンクからお願いします。

正規分布（ガウス分布）

　正規分布（ガウス分布、normal distribution）は、連続型の確率分布です。正規分布は数学的にも便利な性質をたくさん持っているため…

多変量正規分布

　正規分布に従う確率変数をベクトルの形でまとめたものは、多変量正規分布（multivariate normal distribution）に従い…

1 多変量正規分布の基本情報
- 1.1 記号の定義
2 行列変量正規分布と多変量正規分布
3 行列変量正規分布に従う確率変数の線形関数
4 行列変量正規分布とウィシャート分布
5 条件付き行列変量正規分布
6 行列変量正規分布と関連深い確率分布

多変量正規分布の基本情報

※　表は横にスクロールできます。

パラメータ	\(M,\ \ \ 0 < U,\ V\) ただし、\(U,\ V >0\)は\(U,\ V\)が正定値行列を表します。
確率変数の範囲	\(-\infty< x_{ij} <\infty \),（\(i=1,\cdots,n,\ \ j=1,\cdots,p\)）
確率密度関数	\(\displaystyle \frac{1}{(2\pi)^{\frac{1}{2}np}\|U\|^{\frac{1}{2}p}\|V\|^{\frac{1}{2}n}}\exp\left[ -\frac{1}{2}\mathrm{tr} \left\{ U^{-1}(X-M)V^{-1}\,{}^{T}\!(X-M) \right\} \right] \)
積率母関数	\(\displaystyle \exp\left[ \mathrm{tr}\left( {}^{T}\!MT \right)+\frac{1}{2}\mathrm{tr}\left( {}^{T}\!TUTV \right) \right] \)
期待値	\( \displaystyle M \)
分散共分散行列（確率変数をベクトル展開したもの）	\( \displaystyle U\otimes V \) 確率変数\(X\)の列ベクトルをひとつに並べたベクトルの分散共分散行列を表します。

記号の定義

クロネッカー積\(\otimes\)
\(p\times q\)の行列\(A\)と、\(s\times t\)の行列\(B\)のクロネッカー積\(A\otimes B\)は次のように定義します。
\begin{align}
(A\otimes B)_{ij} = (a_{ij}B)_{ij},\ \ \ (i=1,\cdots,p,\ \ \ j=1,\cdots,q)
\end{align}
ベクトル展開\(\mathrm{vec}\)
行列\(X=(x_{1},\cdots,x_{n})\)（\(x_{1},\cdots,x_{n}\)は行列\(X\)の列ベクトルを表します）について、ベクトル展開\(\mathrm{vec}(X)\)とは次のように定義します。
\begin{align}
\mathrm{vec}(X) = \left(\begin{array}{c}
x_{1} \\
\vdots \\
x_{n}
\end{array}\right)
\end{align}

行列変量正規分布と多変量正規分布

行列変量正規分布と多変量正規分布

行列変量正規分布に従う確率変数\(X\sim N_{n\times p}(M,U,V)\)は、多変量正規分布\(N_{np}(\mathrm{vec}(M),U\otimes V)\)と同値となります。（これは逆も成り立ちます。）

証明

　確率密度関数を書き換えていきます。まず指数部分について計算すると

\begin{align}
-\frac{1}{2}\mathrm{tr}\left[ U^{-1}(X-M)V^{-1}\,{}^{T}\!(X-M) \right] &= -\frac{1}{2}\mathrm{vec}\,{}^{T}\!(X-M)\mathrm{vec}\left( U^{-1}(X-M)V^{-1} \right) \\
&= -\frac{1}{2}\mathrm{vec}\,{}^{T}\!(X-M)\left( U^{-1}\otimes V^{-1} \right)\mathrm{vec}\left( X-M)V \right) \\
&= -\frac{1}{2}\,{}^{T}\!\left\{\mathrm{vec}(X)-\mathrm{vec}(M)\right\}\left( U^{-1}\otimes V^{-1} \right)\left\{\mathrm{vec}(X)-\mathrm{vec}(M)\right\}) \\
\end{align}

となります。さらに、クロネッカー積の性質を用いると

\begin{align}
|U\otimes V| &= |U|^{p}|V|^{n}
\end{align}

が成立します。この２つを用いて確率密度関数を書き換えると

\begin{align}
\frac{1}{(2\pi)^{\frac{1}{2}np}|U|^{\frac{1}{2}p}|V|^{\frac{1}{2}n}}\exp\left[ -\frac{1}{2}\mathrm{tr} \left\{ U^{-1}(X-M)V^{-1}\,{}^{T}!(X-M) \right\} \right] &= \frac{1}{(2\pi)^{\frac{1}{2}np}|U\otimes V|^{\frac{1}{2}}}\exp\left[ -\frac{1}{2}\,{}^{T}\!\left\{\mathrm{vec}(X)-\mathrm{vec}(M)\right\}\left( U^{-1}\otimes V^{-1} \right)\left\{\mathrm{vec}(X)-\mathrm{vec}(M)\right\} \right]
\end{align}

となることから、多変量正規分布と一致することがわかります。

□

※多変量正規分布については以下のリンクからお願いします。

多変量正規分布

　正規分布に従う確率変数をベクトルの形でまとめたものは、多変量正規分布（multivariate normal distribution）に従い…

行列変量正規分布に従う確率変数の線形関数

行列変量正規分布に従う確率変数の線形関数

行列変量正規分布に従う確率変数\(X\sim N_{n\times p}(M,U,V)\)はとして、行列\(A,B,C\)をサイズ\(m\times n,\ p\times \ell,\ m\times \ell\)の非特異行列とします。このとき、次のような関係が成り立ちます。

\begin{align} AXB+C \sim N_{m\times \ell}(AMB+C,\ AU\,{}^{T}\!A,\ BV\,{}^{T}\!B) \end{align}

行列変量正規分布とウィシャート分布

　行列変量正規分布に従う確率変数\(X_{i}\sim N_{n\times p}(O,\ I_{n},\ V)\)とします。つまり、期待値\(O\)の任意の行ベクトル同士は互いに独立になっている行列変量正規分布について考えます。このとき、次のような関係が成り立ちます。

\begin{align}
{}^{T}\!XX \sim W_{p}(n,\ V)
\end{align}

ここで\(W_{p}(n,\ V)\)は自由度\(n\)のウィシャート分布を表します。

条件付き行列変量正規分布

　\(n\times p\)の行列変量正規分布に従う確率変数を\(X = (X_{1}\ X_{2})\sim N_{p}(M,\ U,\ V)\)と分割します。ただし、\(X_{1}\)は\(n\times p_{1}\)の確率変数、\(X_{2}\)は\(n\times p_{2}\)の確率変数であり\(p_{1}+p_{2}=p\)が成り立っています。
　\(X\)が行列正規分布に従っていることから、\(X_{1}\)と\(X_{2}\)も行列正規分布に従います。よって

\begin{align}
X_{1}\sim N_{n\times p_{1}}(M_{1},\ U,\ V_{11}),\ \ X_{2} \sim N_{n\times p_{2}}(M_{2},\ U,\ V_{22})
\end{align}

と表すことができます。ただし、\(M\)と\(M_{1},\ M_{2}\)、\(V\)と\(V_{11},\ V_{22}\)とはつぎのような関係があります。

\begin{align}
M=\left( \begin{array}{cc}
M_{1} & M_{2}
\end{array}\right), \ \ \ \ V = \left( \begin{array}{cc}
V_{11} & V_{12}\\
V_{21} & V_{22}
\end{array}\right),\ \ \ \ V_{ij}はp_{i}\times p_{j}の行列です
\end{align}

このとき、次のような関係が成り立ちます。

条件付き行列変量正規分布

\(X_{1}\)が与えられたとき、\(X_{2}\)の条件付き分布も行列変量正規分布に従い、

\begin{align} X_{2}\,|\,X_{1} \sim N_{n\times p_{2}} \left( M_{2}+(X_{1}-M_{1})V_{11}^{-1}V_{12},\ U\otimes(V_{22}-V_{21}V_{11}^{-1}V_{12}) \right) \end{align}

となります。つまり、条件付き期待値、条件付き分散が

\begin{align} \mathrm{E}[X_{2}|X_{1}] &= M_{2}+(X_{1}-M_{1})V_{11}^{-1}V_{12} \\ \mathrm{Var}[X_{2}|X_{1}] &= U\otimes(V_{22}-V_{21}V_{11}^{-1}V_{12}) \end{align}

となる、条件付き行列変量正規分布に従います。

この条件付き行列変量正規分布について、\(n=1)\として転置をとったものは条件付き多変量正規分布と一致します。

多変量正規分布

　正規分布に従う確率変数をベクトルの形でまとめたものは、多変量正規分布（multivariate normal distribution）に従い…

証明は別ページで紹介します（計算が大変なのである程度の計算知識が必要になります）。以下のリンクからどうぞ。

条件付き正規分布【証明付きで解説】

　条件付き正規分布について証明していきたいと思います。証明は行列変量正規分布で行いますが、多変量正規分布の証明は証明中で\(n=1\)としたもの…

上では\(X_{1}\)を与えた下で\(X_{2}\)の条件付き正規分布を紹介していますが、逆に\(X_{2}\)を与えた下で\(X_{1}\)の条件付き正規分布を与えることもあります。このとき、条件付き期待値と条件付き分散は

\begin{align}
\mathrm{E}[X_{1}|X_{2}] &= M_{1}+(X_{2}-M_{2})V_{22}^{-1}V_{21} \\
\mathrm{Var}[X_{1}|X_{2}] &= U\otimes(V_{11}-V_{12}V_{22}^{-1}V_{21})
\end{align}

となります。

多変量正規分布の基本情報

記号の定義

行列変量正規分布と多変量正規分布

証明

行列変量正規分布に従う確率変数の線形関数

行列変量正規分布とウィシャート分布

条件付き行列変量正規分布

行列変量正規分布と関連深い確率分布