スミルノフ・グラブス検定
例題:
「母平均値 μ = 140,母標準偏差 σ = 8 である正規母集団から 20 個のデータを抽出したところ,表 1 のような結果が得られた。この測定値の中の 164 は他と比べてかなり外れているようであるが,このデータは捨てた方がよいだろうか。有意水準 5% で検定しなさい。」
133 | 134 | 134 | 134 | 135 | 135 | 139 | 140 | 140 | 140 |
141 | 142 | 142 | 144 | 144 | 147 | 147 | 149 | 150 | 164 |
標本平均=141.7 | 標本分散=55.0632 |
検定手順:
- 前提
- 標本の大きさを n,標本データを,X1,X2, … ,Xn とする。
- 標本平均を ,不偏分散を U とする。
- 最大の測定値 Xi について次式による Ti を求める(平均値より小さい方の外れ値の場合には,最小の測定値について計算する)。
例題では,
- 統計数値表から有意点 t を求める。
例題では,t = 2.557 である。
- 帰無仮説の採否を決める。
- Ti < t のとき,帰無仮説を採択する。「データのうち,最大(最小)のものは外れ値であるとはいえない」。
- Ti ≧ t のとき,帰無仮説を棄却する。「データのうち,最大(最小)のものは外れ値である」。
例題では,有意水準 5% で検定を行うとすれば,X20 = 164 は“外れ値”とすることになる。
注1:この検定では,1回につき1個の外れ値を検出することになる。複数個の外れ値がある場合は,最も大きなものについてまず検定を行い,それが外れ値だとすると次の段階ではそれを除いた n-1 個のデータについて同じように検定を行うということを繰り返す。
注2:データを安易に棄却する(捨てる)べきではない。外れ値が生じた真の原因を突き止めてから!!
スミルノフ・グラブス検定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/02/29 05:31 UTC 版)
より精密には、正規分布を仮定して、スミルノフ・グラブス (Smirnov‐Grubbs) 検定を使う。標本数を n、所要の有意水準を α、自由度 n - 2 のt分布の α / n × 100 パーセンタイルを t として、 τ = ( n − 1 ) t n ( n − 2 ) + n t 2 {\displaystyle \tau ={\frac {(n-1)t}{\sqrt {n(n-2)+nt^{2}}}}} を有意点とする。この式は再帰的に使う。つまり、最も外れた1標本のみを検定し、それが外れ値と判定されたら、それを除外した n - 1 個の標本を使って2番目に外れた標本を検定し、以下、外れ値が検出されなくなるまで繰り返す。
※この「スミルノフ・グラブス検定」の解説は、「外れ値」の解説の一部です。
「スミルノフ・グラブス検定」を含む「外れ値」の記事については、「外れ値」の概要を参照ください。
スミルノフグラブス検定と同じ種類の言葉
検定に関連する言葉 | フリードマン検定 コクランアーミテージ検定 スミルノフグラブス検定 コクランのQ検定 母平均の検定 |
- スミルノフグラブス検定のページへのリンク