Excelを使ってデータを分析する際、平均値だけでは見えてこない「データの真ん中」を知りたい場面は多いものです。
そんなときに役立つのが中央値(メジアン)という統計指標であり、Excelでは専用の関数を使って簡単に求めることができます。
本記事では「【Excel】エクセルでの中央値の求め方・出し方(MEDIAN関数・条件付き中央値・グラフへの表示も)」というテーマで、基本的なMEDIAN関数の使い方から、条件を絞った応用的な中央値の算出方法、さらにはグラフへの視覚的な表示方法まで幅広く解説していきます。
初心者の方でも迷わずに使いこなせるよう、丁寧にお伝えしていきますので、ぜひ最後までご確認ください。
ExcelのMEDIAN関数を使えば中央値は一瞬で求められる
それではまず、Excelで中央値を求める最もシンプルな方法であるMEDIAN関数について解説していきます。
中央値とは、データを小さい順に並べたときにちょうど真ん中に位置する値のことを指します。
たとえば「10・20・30・40・50」という5つのデータであれば、中央値は30になります。
平均値はデータの合計を個数で割ったものですが、極端に大きい値や小さい値(外れ値)が含まれている場合、平均値は実態からズレてしまうことがあります。
一方で中央値は外れ値の影響を受けにくいため、給与データや不動産価格など、ばらつきの大きいデータを扱う際に特に有効な指標です。
MEDIAN関数の基本構文
ExcelのMEDIAN関数の構文はとてもシンプルで、以下のように記述します。
=MEDIAN(数値1, 数値2, …)
または
=MEDIAN(セル範囲)
引数には数値を直接入力することも、セル範囲を指定することも可能です。
たとえばA1からA10にデータが入力されている場合、「=MEDIAN(A1:A10)」と入力するだけで中央値が自動的に計算されます。
データの個数が奇数の場合は真ん中の値がそのまま中央値になり、偶数の場合は中央に位置する2つの値の平均が中央値として返される仕様です。
実際の入力手順
中央値を求めたいセルを選択した状態で、数式バーに「=MEDIAN(」と入力します。
続いて対象となるセル範囲をマウスでドラッグして選択し、括弧を閉じてEnterキーを押すだけで完了です。
関数の挿入ダイアログを使いたい場合は、「数式」タブ → 「その他の関数」 → 「統計」の中からMEDIANを選ぶことで、引数をGUIで設定することもできます。
MEDIAN関数使用時の注意点
MEDIAN関数はテキスト(文字列)や空白セルを自動的に無視して計算してくれます。
ただし、数値として入力されているように見えても、実際は文字列として保存されているセルは計算対象外になってしまうため注意が必要です。
数値が正しく認識されているかどうかは、セルの書式設定や左寄り・右寄りの表示で確認するとよいでしょう。
MEDIAN関数は外れ値に強い統計指標である「中央値」を求めるための最もシンプルな関数です。
データ個数が奇数なら真ん中の値、偶数なら中央2値の平均が返されます。
条件付き中央値の求め方(MEDIAN関数とIF関数の組み合わせ)
続いては、特定の条件を満たすデータだけを対象に中央値を求める方法を確認していきます。
Excelには「MEDIANIF」という関数は存在しません。
そのため、条件付き中央値を求めるにはMEDIAN関数とIF関数を組み合わせた配列数式を使う必要があります。
MEDIAN×IF配列数式の構文と入力方法
条件付き中央値を求める基本的な数式は以下のとおりです。
=MEDIAN(IF(条件範囲=条件値, 中央値を求めたい範囲))
入力後は「Ctrl + Shift + Enter」で確定(配列数式として入力)
たとえば、A列に「部門名」、B列に「売上金額」が入力されており、「営業部」の売上の中央値を求めたい場合は以下のように記述します。
=MEDIAN(IF(A2:A20=”営業部”, B2:B20))
→ Ctrl + Shift + Enter で確定
この数式を通常のEnterで確定させてしまうと正しい結果が返らないため、必ずCtrl + Shift + Enterで入力することを忘れないようにしましょう。
正しく配列数式として入力されると、数式バーには「{=MEDIAN(IF(…))}」のように波括弧が自動的に付加されます。
Excel 365・2019以降はFILTER関数との組み合わせも可能
Excel 365またはExcel 2019以降のバージョンをお使いであれば、FILTER関数と組み合わせたより直感的な方法も使えます。
=MEDIAN(FILTER(B2:B20, A2:A20=”営業部”))
→ 通常のEnterで確定できる
FILTER関数が条件に合ったデータだけを抽出し、そのデータをMEDIAN関数で処理するという流れです。
配列数式の操作が不要なため、ミスが起きにくく非常に扱いやすい方法といえるでしょう。
複数条件で中央値を求める場合
複数の条件を組み合わせたい場合は、IF関数を入れ子にする方法か、条件を掛け算(乗算)でつなぐ方法があります。
=MEDIAN(IF((A2:A20=”営業部”)*(C2:C20=”東京”), B2:B20))
→ Ctrl + Shift + Enter で確定
「*」で条件をつないだ場合、両方の条件がTRUEのときだけ対象データとして扱われます。
条件が増えるほど数式は複雑になりますが、考え方はシンプルですので、ひとつずつ確認しながら組み立てていくとよいでしょう。
中央値をExcelのグラフに表示する方法
続いては、算出した中央値をグラフ上に視覚的に表示する方法を確認していきます。
データをグラフ化する際に中央値のラインを加えることで、分布の特徴や傾向が一目で把握しやすくなるという大きなメリットがあります。
補助列を使って中央値ラインを追加する方法
最もよく使われる方法は、補助列として中央値を入力した列を用意し、折れ線グラフや散布図として追加するやり方です。
以下の手順で進めていきましょう。
| 手順 | 操作内容 |
|---|---|
| 1 | 元データの隣に「中央値」列を作成し、全行に同じMEDIAN関数の結果を入力する |
| 2 | 元データと中央値列を選択した状態でグラフを挿入する |
| 3 | 元データ系列を棒グラフ、中央値系列を折れ線グラフに変更する |
| 4 | 折れ線の書式(色・太さ)を調整して見やすく仕上げる |
中央値列は「=MEDIAN($B$2:$B$20)」のように絶対参照で固定しておくと、すべての行で同じ値が表示されます。
これにより、グラフ上で水平な中央値ラインが描かれる形になります。
箱ひげ図で中央値を確認する方法
Excel 2016以降では、箱ひげ図(ボックスプロット)というグラフ種類が標準で搭載されています。
箱ひげ図はデータの分布・中央値・四分位数・外れ値をまとめて視覚化できる非常に便利なグラフです。
挿入タブ → 「統計グラフの挿入」 → 「箱ひげ図」を選択するだけで、中央値が自動的に箱の中央のラインとして表示されます。
統計的なデータ分析や比較を行う場面では、箱ひげ図の活用が特におすすめです。
グラフ上にデータラベルとして中央値を表示する
折れ線グラフとして追加した中央値系列を右クリックし、「データラベルの追加」を選ぶことで、グラフ上に数値を直接表示させることも可能です。
ラベルの位置や書式は「データラベルの書式設定」から細かく調整できます。
中央値の数値そのものをグラフ上で明示したい場合に、ぜひ活用してみてください。
中央値・平均値・最頻値の違いと使い分け
続いては、中央値と混同されやすい平均値・最頻値との違いと、それぞれの使い分けを確認していきます。
データ分析において、どの代表値を使うかによって見えてくる情報が大きく変わることを理解しておくことが重要です。
平均値・中央値・最頻値の定義と特徴
まず3つの代表値の定義と特徴を整理しておきましょう。
| 代表値 | 定義 | Excelの関数 | 特徴 |
|---|---|---|---|
| 平均値(Mean) | 全データの合計 ÷ 個数 | AVERAGE関数 | 外れ値の影響を受けやすい |
| 中央値(Median) | データを並べたときの真ん中の値 | MEDIAN関数 | 外れ値の影響を受けにくい |
| 最頻値(Mode) | 最も多く登場する値 | MODE関数 | カテゴリデータにも使いやすい |
たとえば年収データにおいて、一部の超高所得者が含まれる場合、平均年収は大きく引き上げられてしまいます。
一方で中央値を見れば、より「一般的な水準」を反映した数字が得られます。
日本の公的統計でも年収の代表値として中央値が多く使われているのは、このような理由からです。
どのような場面で中央値を選ぶべきか
以下のような状況では中央値の使用が特に推奨されます。
中央値が有効なシーン
・データに外れ値(極端に大きい・小さい値)が含まれている場合
・給与・不動産価格・資産額など、分布が左右非対称のデータを扱う場合
・「全体の半数より上か下か」を判断する基準が必要な場合
逆に、データが正規分布に近く、外れ値もほとんどない場合は平均値の方が全体の傾向をよく表すこともあります。
目的とデータの性質に合わせて代表値を選ぶ視点を持つことが、データ分析の精度を高める第一歩といえるでしょう。
四分位数との組み合わせでさらに深い分析を
中央値はデータ全体の50パーセンタイルに相当しますが、四分位数(25・50・75パーセンタイル)と組み合わせることでデータの散らばり具合をより詳しく把握できます。
ExcelではQUARTILE関数またはQUARTILE.INC関数を使って四分位数を求めることが可能です。
中央値を中心に、第1四分位数(Q1)と第3四分位数(Q3)の範囲(四分位範囲・IQR)を確認することで、データの分布の安定性や外れ値の存在を客観的に評価できます。
まとめ
本記事では「【Excel】エクセルでの中央値の求め方・出し方(MEDIAN関数・条件付き中央値・グラフへの表示も)」というテーマで、Excelを使った中央値の算出方法を多角的にご紹介しました。
MEDIAN関数は構文がシンプルで、セル範囲を指定するだけで中央値が瞬時に求められます。
条件付きで中央値を出したい場合は、MEDIAN×IF配列数式またはExcel 365以降ならFILTER関数との組み合わせが便利です。
グラフに中央値を表示したい場合は補助列を活用した折れ線グラフの追加や、箱ひげ図の利用が効果的な方法といえます。
また、平均値・最頻値との違いを理解した上で、データの性質に応じて適切な代表値を選ぶことが、より精度の高いデータ分析につながります。
今回ご紹介した内容を参考に、Excelでの中央値の活用をぜひ実務に役立ててみてください。