学習レベル:中学生 難易度:★☆☆☆☆
データを収集できたら、データはそのまま放置せず、ある程度まとめて整理したほうが、情報を把握しやすくなります。前回の記事では統計学では最もポピュラーな度数分布表についてまとめました。この記事では[表]と[図]の両方の特徴をもつ「幹葉図」について紹介します。
幹葉図とは
あまり、馴染みのないデータの整理法だと思います。
それもそうで、適用できるデータの種類が限られているのです!
具体的にはどのようなデータに使えますか?
「テストの成績」や「家賃」などのデータが使えます。
実際に幹葉図を使ってデータ整理をしてみましょう!
度数分布表でも使用したデータをつかってみましょう!
4 8 9 10 17 21 21 25 26 28
29 31 33 33 36 36 36 37 39 42
43 44 51 51 53 54 58 59 61 61
62 62 62 65 67 67 68 69 75 75
76 77 78 81 83 85 86 93 94 99
”「初歩からの統計学」(馬場 裕 著)p.3”
幹葉図は下図のように縦棒|を境に左側が「幹」、右側に「葉」を全てのデータについて記述していきます。
十の位を幹、一の位を葉として、幹葉図を書くと次のようになります。
0\ \ &| \ 489 \\
1\ \ &| \ 07 \\
2\ \ &| \ 115689 \\
3\ \ &| \ 13366679 \\
4\ \ &| \ 234 \\
5\ \ &| \ 113489 \\
6\ \ &| \ 1122257789 \\
7\ \ &| \ 55678 \\
8\ \ &| \ 1356 \\
9\ \ &| \ 234
\end{align}
具体例のように幹になる数字、葉になる数字を決めることで、簡単に作成することができます。
点数がどのように分布しているか、すぐに分かりますね♪
そうなんです!
幹葉図の特長はデータの値を表記しながら、さらにデータの分布に関する情報を与えてくれます!
度数分布表より便利そうなのになぜ馴染みのないのですか?
最初でも言いましたが「使用できるデータが限られている」からです。
幹葉図で利用できるデータの条件は
・ 適度な桁数(150個ぐらいまでのデータ点)でなければならない
→データ点が多すぎると作成の負担、および見栄えに問題が出てきます。
・ データが小さすぎる、大きすぎるものではない
→データが小さいと幹葉図がつぶれてしまいます。逆にデータが大きいと図の表示が困難になり、幹葉図の良さをなくしてしまいます。
どうですか?
かなり条件が厳しいですよね?
幹葉図を利用する機会は少ないでしょうが、適切なデータで使用すると、かなり力を発揮するので是非、覚えておいてください!
幹葉図のまとめ
幹葉図は観測値を表示させながら、データの分布を可視化することができる、珍しいデータ整理の手法です。しかし、使用することができるデータが限られており、幹葉図にふさわしくないデータを利用すると、逆に分かりにくい結果になってしまうので、データ選択は非常に重要になります。