確率分布

F分布

 F分布(F distribution)は、連続型の確率分布です。F分布は正規分布に従う標本の分散に比を取ったりしたときに見られる確率分布です。統計検定や学校の試験など標本を扱い、仮説検定を行う問題が出た場合ほぼほぼ必須の知識になりますので、必ず覚えておきたい分布のひとつとなります。この記事ではF分布の基本情報についてまとめています。F分布を学ぶ前に、<カイ2乗分布>について知っておくとスムーズに学習することができると思います。
 F分布のパラメータは2つの自由度であり、自由度\(m_{1},m_{2}\)のF分布に従う確率変数\(X\)は記号\(X\sim F(m_{1},\ m_{2})\)で表されます。

F分布の基本情報

※ 表は横にスクロールできます。

パラメータ \(m_{1},\ \ m_{2}>0\)(\(m_{1}\)分子、\(m_{2}\)は分母の自由度を表します)
確率変数の範囲 \(0< x <\infty \)
確率密度関数 \(\displaystyle \frac{ \Gamma\left( \frac{1}{2}(m_{1}+m_{2}) \right)\left( \frac{m_{1}}{m_{2}} \right)^{\frac{m_{1}}{2}}x^{\frac{m_{1}}{2}-1} }{ \Gamma\left( \frac{m_{1}}{2}\right)\Gamma\left( \frac{m_{2}}{2} \right) \left( 1+\frac{m_{1}}{m_{2}}x \right)^{\frac{m_{1}+m_{2}}{2}} } \)
※ベータ関数を用いて次のように表されることもあります。
\(\displaystyle \frac{1}{B\left( \frac{m_{1}}{2},\ \frac{m_{2}}{2} \right)}\cdot\frac{ \left( \frac{m_{1}}{m_{2}} \right)^{\frac{m_{1}}{2}}x^{\frac{m_{1}}{2}-1} }{ \left( 1+\frac{m_{1}}{m_{2}}x \right)^{\frac{m_{1}+m_{2}}{2}} } \)
生存関数 \(\displaystyle 1-I_{\gamma}\left( \frac{m_{1}}{2},\ \frac{m_{2}}{2} \right) \)
ここで\(I_{z}(a,b)\)は不完全ベータ関数比を表し\(\gamma\)は次式のものです。
\begin{align}\gamma=\frac{m_{1}x}{m_{2}+m_{1}x}\end{align}
期待値 \( \displaystyle \frac{m_{2}}{m_{2}-2},\ \ \ m_{2}>2 \)
分散 \( \displaystyle \frac{2m_{2}^{2}(m_{1}+m_{2}-2)}{m_{1}(m_{2}-2)^{2}(m_{2}-4)},\ \ \ m_{2}>4 \)
モード \( \displaystyle \frac{m_{2}(m_{1}-2)}{m_{1}(m_{2}+2)},\ \ \ m_{1}>2 \)
歪度 \(\displaystyle \frac{ (2m_{1}+m_{2}-2)\{ 8(m_{2}-4) \}^{\frac{1}{2}} }{ m_{1}^{\frac{1}{2}}(m_{2}-6)(m_{1}+m_{2}-2)^{\frac{1}{2}} } ,\ \ \ m_{2}>6\)
尖度 \( \displaystyle \frac{ 3\left\{ m_{2}-4+\frac{1}{2}(m_{2}-6)\beta_{1} \right\} }{ m_{2}-8 },\ \ \ m_{2}>8\)
ここで、\(\beta_{1}\)は歪度を表します。

証明一覧

確率密度関数と累積分布関数

確率密度関数と累積分布関数を紹介しています。上の方は\(m_{1}=5\)で固定した場合、\(m_{2}=5\)で固定した場合のものになります。

F分布の定義

F分布の定義
互いに独立に従う確率変数、自由度\(m_{1}\)のカイ2乗分布に従う確率変数\(U\)と、自由度\(m_{2}\)のカイ2乗分布に従う確率変数\(V\)を用いて
\begin{align}F=\frac{\frac{U}{m_{1}}}{\frac{V}{m_{2}}}\end{align}
と表した\(F\)は自由度\(m_{1},m_{2}\)のF分布に従うといい、記号\(F(m_{1},m_{2})\)で表されます。

F分布と他の分布との関係

  • \(F(1,\ m_{2})=\{t(m_{2})\}^{2}\)
  • \(F(1,\ \infty)=\{t(\infty)\}^{2}=Z^{2},\ \ \ Z\sim N(0,\ 1)\)
  • \(F(m_{1},\ \infty)\rightarrow \chi^{2}(m_{1})\)
  • \( F(\infty,\ \infty)\rightarrow\chi^{2}(\infty)\sim \)正規分布

F分布はかなり特殊な分布ですが、データ数が十分に大きいとき他の分布に近似することができる分布になります。F分布より容易な分布で考えられるので、これらの近似は覚えておくといいと思います。

正規母集団からの標本分散とF分布

正規母集団からの標本分散とF分布
正規分布に従う異なる母集団から次のようにデータが得られたときを考えます。
\begin{align}X_{i}\sim N(\mu_{1},\ \sigma_{1}^{2}),\ \ \ i=1,\cdots,n_{1}\\ Y_{j}\sim N(\mu_{2},\ \sigma_{2}^{2}),\ \ \ j=1,\cdots,n_{2} \end{align}
ただし、\(X,Y\)は互いに独立とします。このとき、各集団における分散の不偏推定量を
\begin{align}s_{1}^{2}&=\frac{1}{1-n_{1}}\sum_{i=1}^{n_{1}}(X_{i}-\bar{X})^{2}\\ s_{2}^{2}&=\frac{1}{1-n_{2}}\sum_{i=1}^{n_{2}}(Y_{i}-\bar{Y})^{2}\\ \end{align}
とします。この不偏推定量は
\begin{align}U&=(n_{1}-1)\frac{s_{1}^{2}}{\sigma_{1}^{2}} \sim \chi^{2}(n_{1}-1)\\ V&=(n_{2}-1)\frac{s_{2}^{2}}{\sigma_{2}^{2}} \sim \chi^{2}(n_{2}-1)\end{align}
が成り立ちます。2つの分散の比をとることを考えると
\begin{align}F=\frac{ \frac{U}{n_{1}-1} }{ \frac{V}{n_{2}-1} }\sim F(n_{1},\ n_{2})\end{align}
が成り立ちます。

特に、2つの母集団における分散が等しい(\(\sigma_{1}^{2}=\sigma_{2}^{2}\))ときを仮定すると、上の関係式は

\begin{align}F=\frac{s_{1}^{2}}{s_{2}^{2}}\sim F(n_{1}-1,\ n_{2}-1)\end{align}
と書き直すことができます。このような関係式は仮説検定などで使用されます。とても重要なので覚えておきましょう!

-確率分布
-,

© 2024 初心者からはじめる統計学 Powered by AFFINGER5