算術平均を用いる際の注意
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/05 03:37 UTC 版)
科学観測や社会調査から得られるデータでは、算術平均を代表値の一つとして用いる。算術平均が中央値、最頻値、中点値と比べてデータの特徴をよく表すものかどうかを検討する必要がある。正規分布に近い場合は算術平均と標準偏差を用いることは適切だが、そうでない分布の場合は、算術平均値が度数の多い値を示すとはいえない。 例えば、国民(例えば日本人)の所得について考える。このデータでは、一部の高所得者が算術平均値を引き上げてしまい、算術平均値をとる世帯は実際にはほとんどいないということになる。よってこの場合正規分布には従わない。日本の国税庁の民間給与実態統計調査によると、平成29年度の場合、給与所得の算術平均値は423万円だが、最頻値は300万円~400万円の区分であり、ずれている。従って、一般的な世帯の所得をとらえるには中央値や最頻値が有効であるが、所得は97%~99%は所得の対数値が正規分布(対数正規分布)に従っているため、所得の対数値の算術平均、つまり幾何平均を用いるのが適切な所得の代表値であるともいえる。 分布が左右対称でない時、中央値、最頻値を用いると良い場合もある。また、飛び抜けた値(外れ値)がごく少数の場合には、最大と最小を除外した刈込平均(トランケート平均(英語版))を用いることもある。平均が中央値、最頻値、中点値と乖離している場合は刈込平均を含めた平均以外の使用を考えるとよい。
※この「算術平均を用いる際の注意」の解説は、「平均」の解説の一部です。
「算術平均を用いる際の注意」を含む「平均」の記事については、「平均」の概要を参照ください。
- 算術平均を用いる際の注意のページへのリンク