「平均値」と「中央値」と「最頻値」の違いとは?分かりやすく解釈

「平均値」と「中央値」と「最頻値」の違い生活・教育

データの真ん中を意味する言葉として「平均値」「中央値」「最頻値」があります。

これらはどのような違いがあるのでしょうか。

今回は、「平均値」「中央値」「最頻値」の違いについて解説します。

「平均値」とは?

「平均値」とは、「全データの値を合計しデータ数で割って算出される値」を意味する言葉です。

簡単に説明するならば「全部足して総数で割って求められる数」「平均値」です。

「平均値」とは「平らに均した値」を意味しており集団の偏りを無くして算出されるデータ上の真ん中を求めるときに用いられます。

一般的にデータの真ん中を求める際に使われることが多く直感的にも論理的にも理解しやすい一方、突出した値が含まれている場合は正確性に欠けるのが欠点です。


「平均値」の例文

・『努力した割には平均値にも届かず、散々な結果だった』
・『30代の平均値を大きく上回る結果だった』


「中央値」とは?

「中央値」とは、「データを値の大きさ順に並べたときに中央に位置する値」を意味する言葉です。

「中央値」を算出するにはまずデータを昇順もしくは降順の数字の大きさ順に並べます。

整列した値のうち最小から数えても最大から数えても同じ場所となるちょうど中央に位置する数値が「中央値」です。

「中央値」は順番によって決まる値なので大小の関係は影響しても値そのものの差は影響しません。

集団内で値の差が極端な場合でも比較的正確に真ん中の値がわかる反面、全体的な傾向が反映されにくいという欠点があります。

「中央値」の例文

・『20代の給与で中央値が大きく下がっているのは深刻な問題である』
・『個人の感想ではなく中央値を見ないと正確な実情が読み取れない』

「最頻値」とは

「最頻値」とは、「データの中で最も頻繁に多く出てくる値」を意味する言葉です。

「最頻値」が表しているのは「その値データ全体の中で最も多くを占めている」という事実です。

極端な値を示すデータの影響を受けないので実情に近い値に近づく可能性が高く、データごとのばらつきが極端なときでも感覚的な真ん中に近い値がわかります。

データの規模がそれなりに大きくないと役に立たないので調査対象が数人や数個のデータでは「最頻値」は用いられません。

「最頻値」の例文

・『社会の実情を知るには最頻値を参考にすると良い』
・『データ数が多ければ多いほど最頻値が参考になる』

「平均値」と「中央値」と「最頻値」の違い

10点満点のテストを9人に出題しテスト結果が「1点が4人、2点が1人、9点が1人、10点が3人」だったとします。

このデータの「平均値」は全ての点数を合計した45点をデータ数である9人で割った「5点」です。

「中央値」は全てのデータを値順に並べた中央なので「2点」となります。

このデータで最も出現頻度が高いのは4人の1点なので「最頻値」「1点」です。

どれもデータの真ん中を意味していますが「5点」「2点」「1点」とまったく異なる結果となります。

求めているのは全て「データの真ん中」ですが求め方によりこれだけの違いが見られます。

まとめ

データ全体の真ん中を求めるというのは一般的によくやりますが、求め方によって大きな違いが出るので注意が必要です。

「平均値」「中央値」「最頻値」がそれぞれどのような計算方法を用いどんな場合に向いているのかを知り、分析対象や目的ごとに最適な値を使い分けてください。