ヒストグラムとは?
ヒストグラム(度数分布図)とは、度数分布表をグラフ化したものです。度数分布表とはこのような表のことです。
こういった表をヒストグラム化して視覚化することで、より直感的にデータを確認できるようになります。これにより円グラフなどでは分かりづらかったデータも視覚的にチェックできます。
ヒストグラムの特徴と活用方法
ヒストグラムを作成しても、それを活用できなければ意味がありません。
そこで、ヒストグラムにはどういった特徴があるのか、どういう時に活用できるのか見ていきましょう。
異常値の発見や突出したデータの発見が得意
ヒストグラムは、大量のデータから異常値を発見したり、年齢分布傾向などを調べるのに役立ちます。度数分布表をグラフ化することで、各区間(階級)の相対度数や累積度数を調べることができます。
先ほどの度数分布表を観る場合と比較して、「購入件数が多い年齢」と「2番目に購入件数が多い年齢」がひと目でわかったはずです。
ほかにも購入頻度が高い価格帯などもヒストグラムを使って調べることができます。
ヒストグラムと棒グラフの決定的な違い
ヒストグラムは、棒グラフと違って棒と棒の間隔をなくしてグラフ化することが多いです。ですが、ヒストグラムによっては棒と棒の間隔が空いているものもあります。
では棒グラフとヒストグラムの違いは何なのかというと、扱うデータの違いです。
- 棒グラフは棒の並びを変えても問題ないデータを扱う
- ヒストグラムは棒の並びを変えると問題が発生するデータを扱う
例えば、先程のヒストグラムの棒の並びをバラバラにしてみましょう。
わかるとしても、かなり分かりづらかったはずです。ヒストグラムでは棒に順序があるという特徴があり、これこそが棒グラフとの決定的な違いです。
こちらは好きなフルーツに関するアンケートですが、順番を並び替えても何も問題ありませんよね。こういうグラフはヒストグラムではなく棒グラフと呼ばれます。
「棒の幅が広くて棒と棒の間隔がない=ヒストグラム」とは限らないので覚えておきましょう。
Excelでヒストグラムを作成する方法
Excelでヒストグラムを作成する方法は簡単です。
まずは、 ヒストグラムの元となる度数分布表を用意しましょう。度数分布表の用意が面倒という方は、以下の表をコピーペーストしてください。
年齢 | 購入件数 |
10代 | 24 |
20代 | 46 |
30代 | 78 |
40代 | 33 |
50代 | 11 |
60代 | 4 |
この記事では上の度数分布表を使って解説します。
ヒストグラムの種類と分析
ヒストグラムを使って分析するにあたって、様々なヒストグラムが出来上がります。ここでありがちなヒストグラムの種類を見ていきましょう。
一般型
どこにデータが集中しているかわかりやすいため、最も分析が簡単なヒストグラムでしょう。
ふた山型
グラフの山を構成している要素が2つ以上あることが考えられるため、ヒストグラムを複数に分けて層別する必要があります。
歯抜け型
これは元のデータに問題があることが多く、ヒストグラムの意味を成していません。
すそ引き型
左から右にかけてデータが減少しているものを「右すそ引き型」、右から左にかけてデータが減少しているものを「左すそ引き型」といいます。
絶壁型
離れ小島型
この場合、データの測定に誤りがある可能性があるため、注意すべきグラフの一つです。