学習レベル:高校生 難易度:★☆☆☆☆
複数の確率変数が得られる場合の確率分布を考えます。複数の確率変数から確率を表すものを同時確率分布といいます。
回帰分析や人工知能など実データ解析を行う際には、確率変数が1つとは限りません。より正確な推定を行うため、入力データを複数個、準備するため同時確率分布を考える必要があります。
この記事では、確率変数を2個で考えていますが、それ以上でも同じ定義になります。
同時確率分布
■離散型
確率変数が離散型の場合、\(f_{XY}(x,\ y)\)を確率変数\(X,\ Y\)の同時確率関数といいます。同時確率関数は以下のことを満たします。
・ \(\displaystyle f_{XY}(x,\ y)\geq 0 \)
・ \(\displaystyle \sum_{x}\sum_{y} f_{XY}(x,\ y)= 1 \)
■連続型
確率変数が連続型の場合、\(f_{XY}(x,\ y)\)を確率変数\(X,\ Y\)の同時確率密度関数といいます。同時確率密度関数は以下のことを満たします。
・ \(\displaystyle f_{XY}(x,\ y)\geq 0 \)
・ \(\displaystyle \int_{x}\int_{y} f_{XY}(x,\ y)dxdy= 1 \)
確率変数が複数個になった場合、『同時+(確率の用語)』だと考えて大丈夫です。
同時確率分布には以下のようなものがあります(本サイトで扱っているものを紹介しています)。
離散型の同時確率分布
連続型の同時確率分布
周辺確率分布
■離散型
確率変数\(X\)に対する周辺確率分布を考えるとき、このときの確率関数をとくに、\(X\)の周辺確率関数といい、以下で定義されます。
f_{X}(\cdot) = \sum_{y}f_{XY}(x,\ y)
\end{align}
■連続型
確率変数\(X\)に対する周辺確率分布を考えるとき、このときの確率関数をとくに、\(X\)の周辺確率密度関数といい、以下で定義されます。
f_{X}(\cdot) = \int_{y}f_{XY}(x,\ y)dy
\end{align}
同時確率分布のときと同様に、この場合の用語は
『周辺+(確率の用語)』だと考えて大丈夫です。
同時確率分布と周辺確率分布の具体例
文字だけだと理解することが難しいので、具体例をみてイメージを掴みましょう!
確率変数\(X,\ Y\)の同時確率分布を見てみましょう!
ただし、確率変数\(X\)は\(X=a,b,c\)のいずれかをとり、確率変数\(Y\)は\(Y=1,2,3\)のいずれかをとるものとします。このとき確率変数\(X,Y\)の同時確率分布が
\(X\backslash Y\) | \(1\) | \(2\) | \(3\) | 合計 |
\(a\) | \(0.05\) | \(0.05\) | \(0.10\) | \(0.20\) |
\(b\) | \(0.05\) | \(0.15\) | \(0.20\) | \(0.40\) |
\(c\) | \(0.10\) | \(0.10\) | \(0.20\) | \(0.40\) |
合計 | \(0.20\) | \(0.30\) | \(0.50\) | \(1.00\) |
で与えられているとします。
このとき、同時確率分布は上の表の青い部分を指し、周辺確率分布はオレンジ色の部分を指します。
同時確率分布と周辺確率分布は多変量確率分布を扱う上で必須の知識となる為、
必ず覚えておきましょう!