データの整理、表現

データの整理 ~幹葉図~

学習レベル:中学生 難易度:★☆☆☆☆

データを収集できたら、データはそのまま放置せず、ある程度まとめて整理したほうが、情報を把握しやすくなります。前回の記事では統計学では最もポピュラーな度数分布表についてまとめました。この記事では[表]と[図]の両方の特徴をもつ「幹葉図」について紹介します。

幹葉図とは

あまり、馴染みのないデータの整理法だと思います。
それもそうで、適用できるデータの種類が限られているのです!

具体的にはどのようなデータに使えますか?

「テストの成績」や「家賃」などのデータが使えます。
実際に幹葉図を使ってデータ整理をしてみましょう!

度数分布表でも使用したデータをつかってみましょう!

50人のクラスでテストを行ったところ、点数は次のようになった
  4      8      9      10     17     21     21     25      26      28
29     31    33     33     36     36     36     37      39      42
43     44    51     51     53     54     58     59      61      61
62     62    62     65     67     67     68     69      75      75
76     77    78     81     83     85     86     93      94      99
                ”「初歩からの統計学」(馬場 裕 著)p.3”

幹葉図は下図のように縦棒|を境に左側が「幹」、右側に「葉」を全てのデータについて記述していきます。
十の位を幹、一の位を葉として、幹葉図を書くと次のようになります。

\begin{align}
0\ \ &| \ 489 \\
1\ \ &| \ 07 \\
2\ \ &| \ 115689 \\
3\ \ &| \ 13366679 \\
4\ \ &| \ 234 \\
5\ \ &| \ 113489 \\
6\ \ &| \ 1122257789 \\
7\ \ &| \ 55678 \\
8\ \ &| \ 1356 \\
9\ \ &| \ 234
\end{align}

具体例のように幹になる数字、葉になる数字を決めることで、簡単に作成することができます。

点数がどのように分布しているか、すぐに分かりますね♪

そうなんです!
幹葉図の特長はデータの値を表記しながら、さらにデータの分布に関する情報を与えてくれます!

度数分布表より便利そうなのになぜ馴染みのないのですか?

最初でも言いましたが「使用できるデータが限られている」からです。

幹葉図で利用できるデータの条件は
・ 適度な桁数(150個ぐらいまでのデータ点)でなければならない
   →データ点が多すぎると作成の負担、および見栄えに問題が出てきます。
・ データが小さすぎる、大きすぎるものではない
   →データが小さいと幹葉図がつぶれてしまいます。逆にデータが大きいと図の表示が困難になり、幹葉図の良さをなくしてしまいます。

どうですか?
かなり条件が厳しいですよね?
幹葉図を利用する機会は少ないでしょうが、適切なデータで使用すると、かなり力を発揮するので是非、覚えておいてください!

幹葉図のまとめ

幹葉図は観測値を表示させながら、データの分布を可視化することができる、珍しいデータ整理の手法です。しかし、使用することができるデータが限られており、幹葉図にふさわしくないデータを利用すると、逆に分かりにくい結果になってしまうので、データ選択は非常に重要になります。

-データの整理、表現
-,

© 2024 初心者からはじめる統計学 Powered by AFFINGER5