確率

離散型と連続型【確率変数を分類する】

学習レベル:中学生 難易度:★☆☆☆☆

前回の記事で確率変数について定義しました(<確率変数の記事>をご覧ください)。この記事では、確率変数を分類していきます。確率変数の分類によって計算方法が変わるので、データによって使い分けることは常に心掛けるようにしましょう!

確率変数の分類

確率変数は2種類に分類されます。ひとつはサイコロの目\(1,2,3,4,5,6\)のように、観測値が離散的な(とびとびの)値をとるとき離散型(discrete type)といい、身長や体重のように連続的な値(実数値)をとるときを連続型(continuous type)といいます。

「なぜ、このような分類を行う必要があるのか」
身長のデータを用いて見てみましょう!

 身長データを確率変数\(X\)とします。身長は連続型であることはすぐにわかります。このデータを<確率変数の記事>のように身長180(cm)である確率を$$\mathrm{P}(X=180)$$と表します。実は連続型データに対してこの表記は意味を成しません。
 よく考えてください。身長180(cm)ジャストの人って絶対にいないですよね?
仮にいたとしても、身長180(cm)である確率は非常に小さいものになり、確率として意味を持たないものになります。

 このように、連続型のデータに対してデータの1点に対する確率は意味がありません。連続型データは175(cm)~185(cm)である確率$$\mathrm{P}(175\leq X<185)$$で表す必要があります。

連続型データの確率変数で確率を表記する際は、1点ではなく範囲で表すということは覚えておきましょう!

離散型と連続型のまとめ

 確率変数は大きく2つに分類することができ、離散型と連続型があります。名前の通り、「離散型」はデータの観測値と観測値の間がとびとびな値をとるもの(サイコロ、コイン投げなど)であり、「連続型」はデータの観測値が連続的な値をとるもの(身長、気温など)を指します。離散型と連続型では扱いに注意する必要があり、特に連続型の確率変数で確率を求める際は1点では意味がなく、範囲を与えることで意味を与えることができます。

-確率
-, , ,

© 2024 初心者からはじめる統計学 Powered by AFFINGER5