確率の定義【確率を正しく理解する】 | 初心者からはじめる統計学

学習レベル：中学生　難易度：★☆☆☆☆

この記事では確率を定義していきます。確率にはいろいろな種類があります。そのいろいろな種類に合わせて確率を定義していくので、それぞれの確率がどのような状況で用いられるのか、そこを重点的におさえておくと後々役に立っていくと思います。

1 確率の定義
2 確率のまとめ
3 確率の関連記事

確率の定義

早速、確率を定義していきましょう！

確率(probability)

確率：事象の起こりやすさを定量的に表したものであり、事象$A$の起こる確率を$\mathrm{P}(A)$と書きます。

次に確率が満たすべき「確率の公理」を紹介します。
この公理は必ず覚えてください！

確率の公理(コルモゴロフの公理)

数学的に満たすべき確率の3つの性質を紹介します。
１．任意の事象$A$に対して$0\leq \mathrm{P}(A)\leq 1$
２．全事象$\Omega$に対して$\mathrm{P}(\Omega)=1$
３．$A_{1},A_{2},\cdots$が互いに排反な事象ならば次が成り立つ（確率の加法定理）

\begin{align}\mathrm{P}(A_{1}\cup A_{2}\cup \cdots)=\mathrm{P}(A_{1})+\mathrm{P}(A_{2})+\cdots\end{align}

公理を見ただけでは分かりにくいという方に直感的な捉え方を説明しますね！
１．確率は必ず0以上1以下になる
２．確率の事象すべて合わせると1になる
３．同時に起こらない事象の確率は和で表せる。
となります。もう少し分かりやすくサイコロを例に見てみましょう！

１．サイコロの目が出る確率は絶対0以上1以下になります。
２．サイコロで1,2,3,4,5,6のうちどれかが出る確率は1になります。
３．サイコロが1または2が出る確率は、1が出る確率と2が出る確率を足したものになります。

ここからはもう少し具体的に確率を定義していきたいと思います。

より具体的な定義の仕方は、代表的なもので3種類に分かれており

ラプラスの定義（古典的な定義）
頻度による確率の定義
ベイズ的主観確率

となっています。ここからはそれぞれの場合で確率を定義していきたいと思います。

ラプラスの定義（古典的な定義）

高校などで習う確率は、ほとんどの場合がこの場合になります。詳しく見ていきましょう！

　ラプラスの定義は試行によって得られる根元事象について、それらは同様に確からしい確率を持つものである。
　具体的には2つの例を見てみましょう。

コイントスを考える場合、根元事象は表・裏の2種類なので表も裏もそれぞれ確率が$1/2$になります。
サイコロの場合も同様に、根元事象は1,2,3,4,5,6の6種類なので、1,2,3,4,5,6それぞれが出る確率は$1/6$となります。

つまり、根元事象の数が$N$個あるとき、根元事象1個だけしか含まない事象の確率は$1/N$となるものです。

定義から当たり前なんですが、ラプラスの定義ではすべての結果が同じ確率で出ることを仮定しています。

頻度による確率の定義

ここからが統計的推測でよく使われる確率の定義になります。高校などで習う確率は与えられているものでしたが、統計学では確率を推定することが目標になります。早速、頻度による確率の定義を見てみましょう！

　頻度による確率の定義は名前のとおり、試行によって得られた結果をもとに頻度を用いて確率を決める方法である。「偏りが疑われるコイントス」や「細工されたサイコロ」に対してラプラスの定義を用いるのは適切ではないことは、すぐに分かります。このように偏りが疑われる場合には確率の頻度説を用います。

　サイコロの場合を考えます。全部で$N$回サイコロを振ったとき、1の目が出た回数を$n_{1}$とします。このときサイコロの1の目が出る確率を$n_{1}/N$で定義します。確率を頻度による確率は、試行回数を$N\rightarrow \infty$にしたときの確率で定義されます。つまり$$\frac{n_{1}}{N}\rightarrow \alpha　(N\rightarrow \infty)$$となる$\alpha$が頻度による確率になります。

データによって必要な試行回数は異なります。
テレビなどのアンケート調査ではデータ数が十分でなかったり、サンプルデータの選び方に偏りがあったりと、条件が怪しいものも多いです。統計データを見る上でデータ数とサンプルの選び方は非常に重要になります。

ベイズ的主観確率

頻度による確率は何回を試行を行って確率を推定していましたが、データによっては何回もデータがとれない場合があります。このときに使用されるのがベイズ的主観確率です。

ベイズ的主観確率は人工知能などデータの予測などによく使用されています。現段階でベイズ的主観確率を定義することはできないので、イメージで紹介していきます。

　サイコロで1の目が出る確率を求めたいときを考えます。ただし、このサイコロは今までの経験上それぞれの目が出る確率が一定ではないことが推定されていました。そこで、一先ずこれまでの経験上1の目が出る確率を$1/10$とします。
（これがベイズ的主観確率となります。この「経験から、求めたい確率をひとまず$p$とする」という仮定は、人それぞれで異なります。よって人によって異なる仮定で始まることになります。）

その上で、サイコロを1回振ったとき、サイコロで1の目は出ませんでした。この情報が得られた上で、$1$の目が出る確率を書き換えます。この試行を何回も繰り返し行い、$1$の目が出る確率を何回も更新していきます。

　このベイズ的主観確率のメリットは、学習能力があることです。データを何回も読み込ませることで、確率を常に更新していくことができます。これは、人の学習方法とも似ています。人は何回も練習・学習を繰り返し行うことで、より正確な判断を行うことができます。このような性質からベイズ的主観確率は機械学習（AI）に使用されます。

確率のまとめ

確率は事象の起こりやすさを定量的に表したものです。一般的に確率は「確率の公理（コルモゴロフの公理）」を満たすもので定義されています。ここから、さらに大きく3つの種類「ラプラスの定義」「頻度による確率の定義」「ベイズ的主観確率」に分けられることが多いです。

確率の関連記事

・確率の用語：確率を学ぶ上で必要な用語を定義しています。

・事象の演算：事象を扱う上で必要な、事象の演算方法を紹介しています。

・ド・モルガンの法則：事象演算でよく使用される法則です。

・確率の定義：事象を用いて確率を定義しています。