中央値
英語:median
中央値とは、中央値の意味
中央値とは、数値で構成された複数のデータを小さい順番に並べた時に、真ん中に位置する値のことである。数学や統計学の分野でよく使われる用語である。英語では median と表現される。中央値は、例えば10から20までの整数がある場合、小さい方から6番目(あるいは大きい方から6番目)の数の15が中央値となる。
エクセル(Excel)で中央値を算出するには「MEDIAN関数」を使用する。例えば、A2セルからA10セルまでの数値の中央値を求めるには、「=MEDIAN(A2:A10)」とする。
中央値と平均値の違い
平均値とは、複数の数値の合計を、数値の個数で除した値のことである。エクセルでは、「AVERAGE関数」を使用する。例えば、A2セルが1、A3セルが2、A4セルが6の場合、「=AVERAGE(A2:A4)」で求めることができる。平均値は 3 となる。ちなみに「=MEDIAN(A2:A4)」とすると中央値として 2 が表示される。中央値 (ちゅうおうち)
L50値(中央値) (-ち)
中央値(Me)
測定値を小さい順に並べたとき,ちょうど真ん中にくる値である。分布の両端に大きな値や小さな値があっても影響されない(注)。
有効ケース数を n,各ケースの測定値を Xi ( i = 1,2,… ,n )とすると,以下の式で定義される。
例題:「6 人の身長が 156.8,168.7,163.8,154.1,159.6,165.6 であった。中央値を求めよ。」
解答:小さい順に並べると,154.1,156.8,159.6,163.8,165.6,168.7 になる。m = 6 / 2 = 3 ゆえ,3 番目と 4 番目のデータの平均値が中央値 Me である。よって Me = ( 159.6 + 163.8 ) / 2 = 161.7 である。
One more step!
しかし,同点があるときには上の式を直接使うと不適切な場合がある。
例題: 22 個の測定値がある。中央値を求めよ。
測定値:1,1,2,2,2,2,3,3,3,3,3,3,3,3,4,4,4,4,4,4,5,5
解答:定義からいえば,中央値は 3 であるが,もう少しましな推定値を求めよう。
- まずデータ整理のために度数分布表を作る。
測定値 度数 相対度数 累積度数 累積相対度数 1 2 9.1 2 9.1 2 4 18.2 6 27.3 3 8 36.4 14 63.6 4 6 27.3 20 90.9 5 2 9.1 22 100.0 合計 22 100.0
- 定義からいえば,中央値より小さいものは全体の 50%,大きいものは 50% あることになる。しかし,中央値 = 3 としたとき,3 より小さいものは 27.3%,大きいものは 36.4% あることになる。中央値は 3 以上,4 未満の値であるに違いない。
- 測定値 3 を持つ 8 個のデータは 2.5 以上,3.5 未満に 1 / 8 = 0.125 の間隔で均等に分布しているとすると,8 個のデータのもっともらしい値は,2.500,2.625,2.750,2.875,3.000,3.125,3.250,3.375 である。この中の 5 番目と 6 番目のデータの真ん中の値が中央値である。すなわち,Me = ( 3.000 + 3.125 ) / 2 = 3.0625 となる。確かに 3.0625 より小さいデータは 11 個になることが確かめられる。
注意:真の値が 2.5 以上,3.5 未満のとき,四捨五入されて測定値 3 が得られると考えるところがポイント。しかし,8 個のデータがその範囲に均等に分布する保証があるのか?とか,もっともらしい値が 2.500 から始まるのか?ということをつつけば問題もある。
l を中央値のある級間の下限点,F を l 以下の累積度数,fm を中央値のある級間の度数,h を級間の幅として,比例配分により次式を得る。
例題では,n = 22,l = 2.5,F = 6,fm = 8,h = 1 ゆえ,Me = 3.125 となる。
注意:先の例では,Me = 3.0625 であった。これは,8 つの同値のデータが下図の●のように分布しているとしたものである。しかし,▲のように分布していると考える方が一般的かもしれない。このようにすると▲は●より 0.125/2 = 0.0625 大きい方向へずれている。従って,得られる中央値も,Me = (3.0625+3.1876)/2=3.125 となり,上式による結果と一致する。
中央値(中位数、メディアン)
中央値
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/10/31 02:10 UTC 版)
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。(2023年11月) |
この記事は英語版の対応するページを翻訳することにより充実させることができます。(2024年5月) 翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。
|
中央値(ちゅうおうち、英: median)あるいはメジアン、メディアンとは、データや集合の代表値の一つで、順位が中央である値のことである。ただし、データの大きさが偶数の場合は、中央順位2個の値の算術平均をとる。
例えば5人の年齢10歳、32歳、96歳、100歳、105歳からなるデータの中央値は、順位が上からも下からも3である96(歳)となる。0歳の子供が2人増えて7人になると、中央値は32歳となる。
平均値との関係
中央値は平均値と同様に集団の代表値を得る目的で使う。例えば年収からなるデータの場合を考えてみると分かりやすい。
一部の富裕層が平均年収をつり上げてしまう例を考える。人口100人の集落で、90人が年収200万円だとしても、10人が年収5000万円であれば平均年収は680万円となる。
一方中央値は、年収が低い順(高い順)に国民を並べたときに丁度真ん中になる人の年収を表している。この場合、中央値はあいかわらず200万円であり、一部の富裕層の年収が中央値に与える影響はゼロになる。
例えば一人の億万長者が小さな町に引っ越してくれば平均年収はつり上がってしまうが、年収の中央値はたかだか一順位分変わるに過ぎない。
厳密な定義
実確率変数 X の累積分布関数を F(x) とするとき、 F(x) は実数値非単調減少関数、右連続関数となる。この時、次の不等式を満たす実数 m を中央値(メディアン)と呼ぶ。
中央値
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/11 07:50 UTC 版)
詳細は「中央値」を参照 1 / 2 分位数を、中央値、メディアン (median)という。中央値は、平均値に代わり、分布を代表する値として使われる。
※この「中央値」の解説は、「分位数」の解説の一部です。
「中央値」を含む「分位数」の記事については、「分位数」の概要を参照ください。
中央値
「中央値」の例文・使い方・用例・文例
中央値と同じ種類の言葉
- 中央値のページへのリンク