9割が知らない!Excelで中央値を正しく使う秘訣とは?

パソコンパソコン・スマホ教室
スポンサーリンク

データ分析をしていて平均値を出したら、なんだか実感と違う数字になってしまった経験はありませんか?例えば、チームメンバーの売上実績を平均したら、たった一人の突出した成績に引っ張られて、実態とかけ離れた数字になってしまった。そんな時に役立つのが中央値です。でも、意外と多くの人が中央値の正しい使い方や、Excelでの簡単な求め方を知らないんです。この記事では、初心者でも今日から使えるExcelの中央値マスター術を、わかりやすく徹底解説します!

スポンサーリンク
  1. Excelの中央値とは?平均値との決定的な違い
  2. MEDIAN関数で中央値を一瞬で求める方法
    1. 基本的な使い方
    2. 偶数個のデータの場合
    3. 0を除外する方法
  3. 関数なしで中央値を求める手順
  4. 中央値を使うべき5つのシーン
  5. Googleスプレッドシートでの中央値
  6. 中央値と一緒に覚えたい関連指標
  7. 実務で絶対に役立つVBAコードを完全公開!
    1. 複数シートの中央値を一括で計算するコード
    2. 条件付き中央値を自動計算するコード
    3. 外れ値を自動検出して色付けするコード
  8. 現場で本当によくある困った状況と解決策
    1. 状況1データが毎日追加されるのに中央値が自動更新されない
    2. 状況2部門ごと、月ごとなど複数条件での中央値が必要
    3. 状況3データ量が多すぎて計算が遅くて仕事にならない
  9. 知っておくと差がつく!中央値の応用テクニック
    1. 移動中央値で傾向を掴む
    2. 中央値との差を可視化する
    3. 信頼区間を考慮した中央値分析
  10. 実践的なショートカットと時短テクニック
  11. ぶっちゃけこうした方がいい!
  12. よくある質問
    1. 中央値と平均値はどちらを使うべきですか?
    2. データが偶数個の時はどうやって真ん中を決めるのですか?
    3. MEDIAN関数でエラーが出る場合の対処法は?
    4. 中央値は統計学でどのように使われていますか?
  13. 今すぐパソコンやスマホの悩みを解決したい!どうしたらいい?
  14. まとめ

Excelの中央値とは?平均値との決定的な違い

Excelのイメージ

Excelのイメージ

中央値とは、データを小さい順に並べた時に真ん中に位置する値のことです。英語ではメジアン(Median)と呼ばれ、統計学では非常に重要な指標として扱われています。

平均値との最も大きな違いは、極端な値(外れ値)の影響を受けにくいという点です。例えば、あるクラスの5人のお小遣いが1000円、1500円、2000円、2500円、50000円だったとします。平均値を計算すると11400円になりますが、これは実態を表していませんよね。ほとんどの生徒は2500円以下なのに、一人だけ突出して高い金額の影響で平均が大きく引き上げられているからです。

一方、中央値は2000円となり、より実態に近い値を示します。データを小さい順に並べると1000円、1500円、2000円、2500円、50000円となり、真ん中の値が中央値になるわけです。

この特性により、中央値は以下のようなデータ分析に特に有効です。不動産価格の分析では、一部の超高額物件に平均が引っ張られないため、その地域の一般的な価格帯を把握できます。従業員の給与分析では、役員などの高額給与者の影響を排除して、一般従業員の実態を正確に反映できます。商品価格の設定では、市場の中心価格を把握して競争力のある価格を決定できるのです。

MEDIAN関数で中央値を一瞬で求める方法

Excelで中央値を求めるには、MEDIAN関数を使います。この関数を使えば、データが何個あろうと一瞬で中央値を計算できます。

基本的な使い方

MEDIAN関数の書き方は驚くほどシンプルです。基本の構文は次の通りです。

=MEDIAN(数値1, 数値2, …)

実際の使用例を見てみましょう。A1からA10のセルに売上データが入っている場合、中央値を表示したいセルに以下のように入力するだけです。

=MEDIAN(A1:A10)

これだけで、10個のデータの中央値が自動で計算されます。範囲を指定するだけなので、初心者でも簡単に使えますよね。

また、範囲ではなく個別のセルを指定することもできます。例えば、=MEDIAN(A1, B5, C10, D3)のように、バラバラのセルを指定することも可能です。さらに、=MEDIAN(A1:A10, B1:B10)のように、複数の範囲を同時に指定することもできます。

偶数個のデータの場合

データの個数が奇数の場合は、真ん中の1つの値がそのまま中央値になります。しかし、データの個数が偶数の場合はどうなるのでしょうか?

偶数個のデータの場合、真ん中の2つの値の平均値が中央値となります。例えば、データが10個ある場合、小さい順に並べた時の5番目と6番目の値の平均が中央値です。

具体例を見てみましょう。データが50、60、70、80、90、100の6個だった場合、昇順に並べた時の3番目(70)と4番目(80)の平均値である75が中央値となります。

MEDIAN関数を使えば、このような計算も自動で行ってくれます。データが奇数個でも偶数個でも、関数が適切に判断して正しい中央値を返してくれるので安心です。

0を除外する方法

データの中に0が含まれていて、その0を除外して中央値を求めたい場合があります。例えば、売上実績で未達成の月を0としている場合などです。

このような場合は、MEDIAN関数とIF関数を組み合わせます。

=MEDIAN(IF(A1:A10>0, A1:A10))

この数式を入力した後、CtrlキーとShiftキーを押しながらEnterキーを押してください。これで配列数式として認識され、0を除外した中央値が計算されます。

この方法を使えば、0だけでなく特定の条件を満たすデータだけで中央値を求めることもできます。IF関数の条件部分を変更すれば、様々な条件に対応できるのです。

関数なしで中央値を求める手順

関数を使わずに中央値を求めることも可能です。データ数が少ない場合や、計算の仕組みを理解したい場合に有効な方法です。

まず、データが入力されているセル範囲を選択します。次に、データタブをクリックし、並べ替えボタンを押します。昇順を選択してOKをクリックすると、データが小さい順に並び替えられます。

並び替えが完了したら、データの個数を確認します。データが9個なら奇数なので、5番目の値が中央値です。データが10個なら偶数なので、5番目と6番目の値の平均を自分で計算します。

例えば、テストの点数が53点、58点、64点、71点、88点、94点の6個だった場合、並べ替え後の3番目(64点)と4番目(71点)の平均である67.5点が中央値となります。

この手動の方法は、少数のデータセットでは有効ですが、データが多い場合は非効率です。そのため、実務では必ずMEDIAN関数を使うことをおすすめします。

中央値を使うべき5つのシーン

中央値は様々な場面で活用できます。特に効果的な5つのシーンを紹介します。

第一に、給与や所得の分析です。一部の高額所得者の影響を排除して、従業員の実態的な給与水準を把握できます。これは人事評価や給与体系の見直しに役立ちます。

第二に、不動産価格の市場調査です。一部の超高額物件に引っ張られることなく、その地域の一般的な価格帯を正確に把握できます。物件の適正価格の判断材料となるのです。

第三に、テストや試験の成績分析です。極端に高い点数や低い点数の生徒がいる場合、クラス全体の実力をより正確に把握できます。教育プログラムの効果測定にも有効です。

第四に、商品価格の設定です。競合商品の価格を調査する際、中央値を使うことで市場の中心価格を把握し、適切な価格戦略を立てられます。

第五に、プロジェクトの工数見積もりです。過去のプロジェクトデータから工数を見積もる際、外れ値の影響を受けにくい中央値を使うことで、より現実的な見積もりができます。

Googleスプレッドシートでの中央値

Googleスプレッドシートでも、Excelと全く同じ方法で中央値を求められます。MEDIAN関数の使い方は完全に同じです。

=MEDIAN(A1:A10)

この数式をGoogleスプレッドシートのセルに入力するだけで、中央値が計算されます。ExcelとGoogleスプレッドシートの間でファイルを共有する場合でも、MEDIAN関数はそのまま動作するので安心です。

Googleスプレッドシートの利点は、チームでリアルタイムに共同編集できることです。複数人でデータを入力しながら、リアルタイムで中央値が更新されていく様子を確認できます。これは、チームでのデータ分析やプロジェクト管理において非常に便利です。

また、Googleスプレッドシートはクラウドベースなので、どのデバイスからでもアクセスできます。外出先でもスマートフォンやタブレットから中央値を確認できるのです。

中央値と一緒に覚えたい関連指標

中央値を理解したら、一緒に覚えておくと便利な指標があります。これらを組み合わせることで、より深いデータ分析が可能になります。

四分位範囲は、データを4つに分割した時の範囲を示します。25パーセント点から75パーセント点までの範囲で、データのばらつきを表現できます。中央値が50パーセント点に相当するので、四分位範囲と組み合わせることでデータの分布をより詳しく把握できるのです。

最頻値は、データの中で最も頻繁に出現する値です。MODE関数で求められます。最頻値は、大量のデータがある場合に特に有用で、最も一般的な傾向を把握できます。

箱ひげ図は、中央値、四分位範囲、最大値、最小値を一目で把握できるグラフです。Excel 2016以降では、グラフの挿入から統計グラフとして箱ひげ図を選択できます。この図を使えば、データの分布と外れ値を視覚的に理解できます。

これらの指標を中央値と組み合わせることで、単なる数値の羅列ではなく、データの本質的な傾向や特性を深く理解できるようになります。

実務で絶対に役立つVBAコードを完全公開!

Excelのイメージ

Excelのイメージ

実際の業務では、MEDIAN関数だけでは対応しきれない複雑な状況に遭遇することがあります。ここでは、実務で即戦力となるVBAコードを紹介します。

複数シートの中央値を一括で計算するコード

月次レポートで毎月異なるシートに売上データがあり、それぞれの中央値を集計シートに自動出力したい。そんな時に使えるコードです。


Sub 複数シート中央値計算()
Dim ws As Worksheet
Dim 集計シート As Worksheet
Dim 行番号 As Long
Dim 中央値 As Double

Set 集計シート = ThisWorkbook.Sheets("集計")
行番号 = 2

For Each ws In ThisWorkbook.Worksheets
If ws.Name <> "集計" Then
中央値 = WorksheetFunction.Median(ws.Range("B2:B100"))
集計シート.Cells(行番号, 1).Value = ws.Name
集計シート.Cells(行番号, 2).Value = 中央値
行番号 = 行番号 + 1
End If
Next ws

MsgBox "中央値の計算が完了しました!"
End Sub

このコードを使えば、何十枚ものシートがあっても一瞬で全シートの中央値を集計できます。手作業で一つずつ計算していた時間が劇的に短縮されるはずです。

条件付き中央値を自動計算するコード

特定の条件を満たすデータだけで中央値を求めたい場合、配列数式は複雑で初心者には難しいですよね。このVBAコードなら簡単に実現できます。


Sub 条件付き中央値()
Dim データ範囲 As Range
Dim 条件範囲 As Range
Dim 条件値 As String
Dim 配列 As Variant
Dim 抽出データ() As Double
Dim カウンター As Long
Dim i As Long

Set データ範囲 = Range("B2:B100")
Set 条件範囲 = Range("A2:A100")
条件値 = "東京"

配列 = データ範囲.Value
ReDim 抽出データ(1 To データ範囲.Rows.Count)
カウンター = 0

For i = 1 To UBound(配列, 1)
If 条件範囲.Cells(i, 1).Value = 条件値 Then
カウンター = カウンター + 1
抽出データ(カウンター) = 配列(i, 1)
End If
Next i

If カウンター > 0 Then
ReDim Preserve 抽出データ(1 To カウンター)
Range("D2").Value = WorksheetFunction.Median(抽出データ)
Else
MsgBox "条件に一致するデータがありません"
End If
End Sub

例えば、営業部門別の売上中央値を出したい時、このコードで部門名を指定するだけで瞬時に計算できます。

外れ値を自動検出して色付けするコード

データの中に明らかにおかしい値が紛れ込んでいることってありますよね。このコードは、中央値から大きく外れた値を自動で色付けしてくれます。


Sub 外れ値検出()
Dim データ範囲 As Range
Dim セル As Range
Dim 中央値 As Double
Dim 四分位範囲 As Double
Dim 下限 As Double
Dim 上限 As Double

Set データ範囲 = Range("B2:B100")

中央値 = WorksheetFunction.Median(データ範囲)
四分位範囲 = WorksheetFunction.Quartile(データ範囲, 3) - WorksheetFunction.Quartile(データ範囲, 1)

下限 = WorksheetFunction.Quartile(データ範囲, 1) - 1.5 * 四分位範囲
上限 = WorksheetFunction.Quartile(データ範囲, 3) + 1.5 * 四分位範囲

For Each セル In データ範囲
If セル.Value < 下限 Or セル.Value > 上限 Then
セル.Interior.Color = RGB(255, 200, 200)
Else
セル.Interior.ColorIndex = xlNone
End If
Next セル

MsgBox "外れ値のチェックが完了しました!" & vbCrLf & _
"赤く色付けされたセルを確認してください。"
End Sub

統計的な手法(四分位範囲の1.5倍)を使って外れ値を判定しているので、客観的な基準で異常値を見つけられます。

現場で本当によくある困った状況と解決策

状況1データが毎日追加されるのに中央値が自動更新されない

日報や売上データなど、毎日新しい行が追加される表で中央値を計算している場合、範囲を固定していると新しいデータが反映されませんよね。私も最初はこれで悩みました。

解決策テーブル機能を使う

データ範囲を選択して、挿入タブからテーブルを作成します。テーブル名を「売上データ」とした場合、MEDIAN関数は次のように書きます。

=MEDIAN(売上データ)

こうすることで、データを追加するたびに自動的に範囲が拡張され、中央値も自動更新されます。これを知ってから、毎月の範囲修正作業から解放されました!

状況2部門ごと、月ごとなど複数条件での中央値が必要

営業部の4月の売上中央値、経理部の5月の売上中央値など、複数の条件を組み合わせて中央値を出したい場合があります。これは配列数式を使わないと実現できず、初心者には難しいんです。

解決策ピボットテーブルとMEDIAN関数の組み合わせ

まず、データからピボットテーブルを作成します。行に部門、列に月を配置し、値には件数を表示させます。そして、ピボットテーブルの横に補助列を作り、そこでMEDIAN関数を使います。

さらに簡単な方法として、フィルター機能を活用する手もあります。部門列でフィルターをかけ、見えているセルだけの中央値を計算したい場合は、次の関数を使います。

=AGGREGATE(12, 5, B2:B100)

AGGREGATE関数の12は中央値を意味し、5は非表示の行を無視するオプションです。これでフィルターをかけた状態での中央値が自動計算されます。

状況3データ量が多すぎて計算が遅くて仕事にならない

数万行のデータで中央値を計算すると、Excelが固まってしまうことがあります。特に複数の中央値を同時に計算していると、かなりのストレスです。

解決策計算方法を手動に切り替える

数式タブから計算方法の設定を開き、手動計算に切り替えます。そして、データの入力や修正が全て終わってから、F9キーを押して一括再計算します。

また、VBAで計算を一時停止する方法もあります。


Sub 高速計算()
Application.ScreenUpdating = False
Application.Calculation = xlCalculationManual

'中央値の計算処理をここに記述

Application.Calculation = xlCalculationAutomatic
Application.ScreenUpdating = True
End Sub

画面更新と自動計算を停止することで、処理速度が劇的に向上します。私の経験では、10倍以上速くなったケースもありました。

知っておくと差がつく!中央値の応用テクニック

移動中央値で傾向を掴む

株価分析などで使われる移動平均線のように、移動中央値を計算することで、データの長期的な傾向を掴めます。

例えば、過去7日間の移動中央値を計算する場合、次のような数式を使います。

=MEDIAN(OFFSET(B2, -6, 0, 7, 1))

OFFSET関数で動的に範囲を指定することで、各行で直近7日間の中央値を計算できます。この数式を下にコピーすれば、時系列での中央値の変化を追えます。

中央値との差を可視化する

各データが中央値からどれだけ離れているかを視覚化すると、データの分布が一目瞭然になります。

中央値を計算したら、各データとの差を計算する列を作ります。

=B2-$B$101

B101セルに中央値が入っている場合、この数式で各データとの差が計算されます。そして、この差の列に条件付き書式でデータバーを設定すれば、視覚的に分かりやすくなります。

ホームタブから条件付き書式を選び、データバーを選択します。プラスの値とマイナスの値で色を変えることで、中央値より上か下かが瞬時に判断できるようになります。

信頼区間を考慮した中央値分析

より高度な分析として、中央値の信頼区間を計算する方法があります。これは統計的な精度を確認するのに役立ちます。

ブートストラップ法という統計手法を使い、VBAでシミュレーションを行います。


Sub 中央値信頼区間()
Dim 元データ As Range
Dim シミュレーション回数 As Long
Dim 中央値配列() As Double
Dim i As Long, j As Long
Dim サンプルサイズ As Long
Dim ランダムサンプル() As Double

Set 元データ = Range("B2:B100")
シミュレーション回数 = 1000
サンプルサイズ = 元データ.Rows.Count

ReDim 中央値配列(1 To シミュレーション回数)
ReDim ランダムサンプル(1 To サンプルサイズ)

For i = 1 To シミュレーション回数
For j = 1 To サンプルサイズ
ランダムサンプル(j) = 元データ.Cells(Int(Rnd() * サンプルサイズ) + 1, 1).Value
Next j
中央値配列(i) = WorksheetFunction.Median(ランダムサンプル)
Next i

Range("D2").Value = WorksheetFunction.Percentile(中央値配列, 0.025)
Range("D3").Value = WorksheetFunction.Percentile(中央値配列, 0.975)

MsgBox "95%信頼区間" & Range("D2").Value & " ~ " & Range("D3").Value
End Sub

これにより、計算した中央値がどの程度信頼できるかを数値で示せます。

実践的なショートカットと時短テクニック

中央値を頻繁に使う場合、作業効率を上げるショートカットやテクニックを知っておくと便利です。

クイックアクセスツールバーにMEDIAN関数を登録する方法があります。Excelのオプションから、クイックアクセスツールバーのカスタマイズを開き、コマンドから「その他の関数」を選んで追加します。これで、リボンを開かずにワンクリックで関数を挿入できます。

また、名前の定義を活用することで、複雑な数式を簡単にできます。例えば、売上データの範囲にSalesという名前を付けておけば、=MEDIAN(Sales)と書くだけで済みます。

数式タブから名前の管理を開き、新規作成で範囲に名前を付けられます。特に、複数の数式で同じ範囲を参照する場合、この方法は非常に効率的です。

さらに、数式のコピー時に範囲を固定する技も重要です。F4キーを押すことで、セル参照を絶対参照($A$1)、複合参照($A1やA$1)に切り替えられます。中央値を横方向にコピーする場合、列だけを固定したい時などに活用できます。

ぶっちゃけこうした方がいい!

ここまで中央値について色々と解説してきましたが、正直に言うと、実務での中央値の使い方は平均値と必ずセットで計算するというのが最も効率的です。

なぜかというと、平均値と中央値の差を見ることで、データの歪みを一瞬で把握できるからなんですよね。例えば、売上データで平均が200万円なのに中央値が80万円だったら、一部の人が異常に高い売上を上げているか、外れ値が混入しているかのどちらかです。この差を見るだけで、データの状態が健全かどうか判断できます。

私が実務で使っているテンプレートは、常に平均・中央値・最大値・最小値・標準偏差の5つを並べて表示するようにしています。これを一つのセットとして扱うことで、データの全体像が瞬時に理解できるんです。

VBAコードについても、複雑なものを一つ作るより、シンプルなコードを複数パターン用意しておく方が断然使いやすいです。状況に応じて使い分けられますし、トラブルシューティングも簡単になります。完璧を目指すより、実用性重視で80点のコードを素早く作る方が、結果的に業務効率は上がりますよ。

最後に一つ。中央値を使うべきか平均値を使うべきか迷った時は、とりあえず両方計算してグラフにしてみるのが一番です。箱ひげ図を作れば、どちらが適切かは一目瞭然になりますから。考えるより先に手を動かす。これが、データ分析で一番大切なマインドセットだと、私は思っています。

よくある質問

中央値と平均値はどちらを使うべきですか?

データに外れ値が含まれている場合や、データの分布が偏っている場合は中央値を使うべきです。逆に、データが正規分布に近く、外れ値がほとんどない場合は平均値が適しています。実務では、両方を計算して比較することで、データの特性をより深く理解できます。平均値と中央値の差が大きい場合、それはデータに偏りや外れ値があることを示しています。

データが偶数個の時はどうやって真ん中を決めるのですか?

データが偶数個の場合、真ん中に位置する2つの値の平均値が中央値となります。例えば、10個のデータがある場合、小さい順に並べた時の5番目と6番目の値を足して2で割った値が中央値です。MEDIAN関数を使えば、この計算を自動で行ってくれるので、手動で計算する必要はありません。

MEDIAN関数でエラーが出る場合の対処法は?

MEDIAN関数でエラーが出る主な原因は、範囲内に数値以外のデータが含まれている場合です。ただし、文字列や空白セルは自動的に無視されるので、通常はエラーにはなりません。エラーが出る場合は、範囲指定が正しいか、セルに不正な値が入っていないかを確認してください。また、シート名に特殊文字が含まれている場合もエラーの原因となることがあります。

中央値は統計学でどのように使われていますか?

統計学において、中央値は代表値の一つとして重要な役割を果たします。平均値、最頻値とともに、データの中心傾向を示す指標として使われます。特に、ノンパラメトリック統計(分布を仮定しない統計手法)では、平均値よりも中央値が好んで使われます。医学研究や社会科学研究など、データの分布が正規分布しないことが多い分野では、中央値が標準的な指標として活用されています。

今すぐパソコンやスマホの悩みを解決したい!どうしたらいい?

LINE公式

いま、あなたを悩ませているITの問題を解決します!
「エラーメッセージ、フリーズ、接続不良…もうイライラしない!」

あなたはこんな経験はありませんか?

✅ ExcelやWordの使い方がわからない💦
✅ 仕事の締め切り直前にパソコンがフリーズ💦
✅ 家族との大切な写真が突然見られなくなった💦
✅ オンライン会議に参加できずに焦った💦
✅ スマホの重くて重要な連絡ができなかった💦

平均的な人は、こうしたパソコンやスマホ関連の問題で年間73時間(約9日分の働く時間!)を無駄にしています。あなたの大切な時間が今この悩んでいる瞬間も失われています。

LINEでメッセージを送れば即時解決!

すでに多くの方が私の公式LINEからお悩みを解決しています。

最新のAIを使った自動応答機能を活用していますので、24時間いつでも即返信いたします。

誰でも無料で使えますので、安心して使えます。

問題は先のばしにするほど深刻化します。

小さなエラーがデータ消失重大なシステム障害につながることも。解決できずに大切な機会を逃すリスクは、あなたが思う以上に高いのです。

あなたが今困っていて、すぐにでも解決したいのであれば下のボタンをクリックして、LINEからあなたのお困りごとを送って下さい。

相談しに行く

ぜひ、あなたの悩みを私に解決させてください。

まとめ

Excelの中央値は、MEDIAN関数を使うことで誰でも簡単に求められます。データを小さい順に並べた時の真ん中の値という定義はシンプルですが、外れ値の影響を受けにくいという強力な特性を持っています。

平均値だけでなく中央値も計算する習慣をつけることで、データの本質的な傾向をより正確に把握できるようになります。給与分析、不動産価格調査、テスト結果の評価など、様々な場面で中央値は威力を発揮します。

今日からあなたも、MEDIAN関数を使って、より精度の高いデータ分析を実践してみてください。きっと、今まで見えていなかったデータの真実が見えてくるはずです!

コメント

タイトルとURLをコピーしました