単変量解析
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/09 22:55 UTC 版)
単変量解析(英語版)では、中心傾向(平均値、中央値、最頻値)と分散(データセットの範囲(英語版)と四分位数、分散や標準偏差などの広がりの尺度)を含む、単一変数の分布を記述する。分布の形状は、歪度や尖度などの指標によって記述することもできる。変数の分布の特性は、ヒストグラムや幹葉表示など、グラフまたは表形式で表すこともできる。 正規分布の場合は、平均と、分散または標準偏差で分布を記述できる。正規分布からのずれを知るためには、尖度や歪度などの高次モーメントから求められる統計量を用いる。 正規分布から著しく外れた場合には、より頑健な中央値、四分位点、最大値・最小値や最頻値が用いられる。「頑健」とは分布の非対称性や外れ値などの影響を受けにくいことを意味する統計用語である。例えば、労働者一人あたりの年収を例に採れば、最も収入が少なくても0未満にはならないのに対し、収入が多いほうでは数十億円という年収を稼ぐ少数者があり得る。この場合の分布は、少数者が上側にいることによって、上側に極端に尾を引いた非対称な分布となる。平均値はこれらの極端な高値の影響を受け、分布の代表値として適切でないものとなってしまう。中央値や最頻値では、いかに飛び抜けた値であっても1例としてしか扱われないので、より大多数の実感に近い値を示すことができる。
※この「単変量解析」の解説は、「要約統計量」の解説の一部です。
「単変量解析」を含む「要約統計量」の記事については、「要約統計量」の概要を参照ください。
- 単変量解析のページへのリンク