表記法と例
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/03/22 22:48 UTC 版)
例えば、4つの数が観測され記録されたとすると、標本の大きさは n = 4 {\displaystyle n=4} となる。各観測値は以下のようであったとする。 6, 9, 3, 8, これを通常、次のように表記する。 x 1 = 6 ; x 2 = 9 ; x 3 = 3 ; x 4 = 8 {\displaystyle x_{1}=6;x_{2}=9;x_{3}=3;x_{4}=8} x i {\displaystyle x_{i}} の添え字 i は記録上の順序を単に表し、通常は重要ではない。時系列では順序が重要となる。 順序統計量では次のように表記する。 x ( 1 ) = 3 ; x ( 2 ) = 6 ; x ( 3 ) = 8 ; x ( 4 ) = 9 {\displaystyle x_{(1)}=3;x_{(2)}=6;x_{(3)}=8;x_{(4)}=9} ここで括弧で囲まれた添え字 (i) が順序統計量での i 番目の値を表す。 順序統計において、第一順序統計量(または最小順序統計量)は最小値を表し、次のように表記される。 X ( 1 ) = min { X 1 , … , X n } {\displaystyle X_{(1)}=\min\{X_{1},\dots ,X_{n}\}} ここで、確率変数を示す一般的な記法として大文字を使用している。小文字は具体的な観測値を指すのに使われる。 同様に大きさ n の標本で第 n 順序統計量(または最大順序統計量)は最大値を表し、次のように表記される。 X ( n ) = max { X 1 , … , X n } . {\displaystyle X_{(n)}=\max\{X_{1},\dots ,X_{n}\}.} より一般的に順序統計量は X ( 1 ) ≤ X ( 2 ) ≤ ⋯ ≤ X ( n ) {\displaystyle X_{(1)}\leq X_{(2)}\leq \dots \leq X_{(n)}} の関係で与えられる。 観測値の範囲は最大値と最小値の差である。これは明らかに順序統計量の関数となっている。 Range { X 1 , … , X n } = X ( n ) − X ( 1 ) . {\displaystyle {\text{Range}}\{X_{1},\dots ,X_{n}\}=X_{(n)}-X_{(1)}.} 探索的データ解析での類似の重要な統計量である四分位数は順序統計量に関係している。 標本の中央値(第2四分位点)は順序統計量となる場合もあるし、そうでない場合もある。というのは、標本の大きさ n {\displaystyle n} が奇数であった場合だけ唯一の中央値が存在するからである。正確に言えば、 n = 2 m + 1 {\displaystyle n=2m+1} となる整数 m {\displaystyle m} があるとき、中央値 X ( m + 1 ) {\displaystyle X_{(m+1)}} は順序統計量である。一方、 n {\displaystyle n} が偶数の場合は n = 2 m {\displaystyle n=2m} となるので、中央値の候補は X ( m ) {\displaystyle X_{(m)}} と X ( m + 1 ) {\displaystyle X_{(m+1)}} の2つとなり、中央値はこれらの関数(一般に平均)で表されるため、順序統計量とは言えない。同様の注意はあらゆる標本分位点を求める際にも必要となる。
※この「表記法と例」の解説は、「順序統計量」の解説の一部です。
「表記法と例」を含む「順序統計量」の記事については、「順序統計量」の概要を参照ください。
- 表記法と例のページへのリンク