中央値(メディアン)とは?
中央値(メディアン)とは、複数のデータにおける真ん中の値のことを言います。平均値と似ているような気がするけど違いはなんだろう?と思われる方も多いと思いますので、まず例をご紹介します。

これは7人のテストの点数をまとめた表です。
平均値の場合、点数の合計をだして人数で割れば求められますね。合計点515÷7=平均点73.5714286 これが平均値となります。

一方、中央値はデータを大きいもしくは小さい順に並べ替えて真ん中にくる値のことを言います。
この表は上の表の点数を昇順に並べ替えたものです。7つのデータでちょうど真ん中に位置するのが赤字で塗ったところです。つまり中央値は78となります。
中央値(メディアン)は何に使う?

ではこの中央値は何に使うのでしょうか?
値にバラつきのある複数のデータがあり、その中に飛び抜けて大きい値もしくは小さい値が含まれていたとします。平均値の場合は飛び抜けた値が入ると値に影響を受けやすいです。
例えば、普通体型で体重50キロ前後の人が5人いたとして、そこに200キロ級のお相撲さんが入ってくると一気に平均体重75キロへ跳ねがります。データの平均をとって体重75キロの人向けのTシャツを作ってみたら、見事にサイズの合う人がいない!なんてこともあるかもしれませんね。つまり平均値は極端な値の影響を受けやすいというデメリットがあります。
一方、中央値の場合極端な値には影響を受けません。お相撲さんが入ってきても6人の体重を並べ替えた真ん中の値は50キロ前後です。中央値の場合実際のデータから真ん中を引っ張ってきたものなので、平均値のように実際のデータから乖離することはありません。全体的な傾向を掴みたい場合であれば平均値を使い、実例の真ん中を使いたければ中央値を使うと良いでしょう。
このように中央値と平均値の違いを踏まえて、何に使うか使い分けられるとより効果的なデータが求められます。
Excelで中央値(メディアン)を計算する方法
ExcelのMEDIAN関数を使うことで中央値を簡単に計算することができるので、MEDIAN関数を使った中央値の求め方についてご紹介します。

点数の平均値と中央値を、以下の数式で求めています。
平均値 =AVERAGE(B2:B8)
中央値 =MEDIAN(B2:B8)
関数を使えば昇順に並べ替える必要なく中央値を計算することができます。
平均値を求める関数
=AVERAGE(対象の範囲)
中央値を求める関数
=MEDIAN(対象の範囲)
0を除く方法
対象の範囲から0を除く必要がある場合、以下のようにして計算できます。


ちなみに今回の場合は対象のセル数が偶数なので、真ん中に位置する赤字の2つの値の、さらに真ん中の値が中央値となります。
つまり(65+78)/2=71.5と中央値は求められます。

使用した数式は以下です。
平均値 =AVERAGE(IF(B2:B9>0,B2:B9))
中央値 =MEDIAN(IF(B2:B9>0,B2:B9))
「IF(B2:B9>0,B2:B9)」で0を除くという条件設定をしています。上記数式を入力し、「control + shift + enter」を押してください。ただenterのみ押して確定するとエラーになりますので注意してくださいね。
すると{}が付加され、配列数式となった状態で計算が行われて、結果が正しく表示されるようになります。
平均値 {=AVERAGE(IF(B2:B9>0,B2:B9))}
中央値 {=MEDIAN(IF(B2:B9>0,B2:B9))}
最後に

Excelを使った中央値の求め方についてご理解いただけましたでしょうか。
中央値と平均値の使い方の違いを覚えて、条件に適したデータを求めることができれば、仕事にも効果を発揮していきそうですよね。その際にはExcelのMEDIAN関数を使って、より作業を効率化していきましょう。