系統抽出法
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/02/12 07:38 UTC 版)
抽出枠の「先頭から m 番目」の要素を開始点として、そこから「n つ飛ばし」に、要素をそれぞれサンプリングする方法(m, n はそれぞれ任意の数)。要素を等間隔に抽出するので等間隔抽出法とも言う。 まず、抽出単位の総数を抽出数で割って抽出間隔を求める。例えば12人の生徒の中から4人の掃除当番を選ぶ場合、12を4で割った答えは3であるから、3人ごとに抽出を行えばよい。その後、先頭の3人の中から開始点を無作為に決める。この時に選んだ乱数を「スタート乱数」と言う。スタート乱数を作為的に選んだ場合は無作為抽出にならないが、スタート乱数を無作為に選んだ場合、全ての要素が同じ確率で選ばれる無作為抽出となる。 抽出単位の総数を抽出数で割った際に余りが出る場合、例えば13人の生徒の中から4人の掃除当番を選ぶ場合、上記の方法でサンプリングを行い、3人ごとに抽出を行っていって4人が選出された時点でサンプリングを終了したとすると、出席番号13の奴が抽出枠から外れることになって不公平である。この場合、13人目以降もいるというテイで、さらにもう1回同様のサンプリングを続けて試行することで、全ての生徒が同じ確率でサンプリングされる無作為抽出となる。もう1回サンプリングを試行した結果、もし出席番号13の奴が5人目の掃除当番としてサンプリングされてしまった場合、5人の中からさらに抽選を行って4名を抽出するとよい。(なお、現実にはそこまで確率的に厳密にすることはあまりなく、スタート乱数は作為的に決められ、割った余りの人を抽出枠に含めるか含めないかも作為的に決められることが多い) 隣り合った要素がサンプリングされることが無いのが特徴。また、「n 番目」を系統的(システマティック)に選出するだけなので、乱数発生器が使えない場合、つまりコンピュータが使えない状況でも人力で行うことが出来る。例えば1200人の全校生徒の中から400人の掃除当番を選ぶ際、系統抽出法を使うとするなら、1から3まで書かれたルーレットを自作して1回回してスタート乱数を決めるだけで、後は掃除当番の人がシステマティックに選出される。無作為性は低くなるが簡易な乱数生成器(現在時刻、脳内でルーレットを回すなど)を使ってスタート乱数を決めた場合、生徒の数に関わらず一瞬で掃除当番の人が決まるのも大きなメリットである。もし単純無作為抽出法を使うとするなら、1から1200まで書かれたルーレットを自作して400回回す必要があり、現実的ではない。 「3の倍数の時にアホが並んでいる名簿」から3つ飛ばしにサンプリングする場合など、標本抽出枠に何らかの規則性が有る場合、無作為抽出にならない欠点がある。
※この「系統抽出法」の解説は、「無作為抽出」の解説の一部です。
「系統抽出法」を含む「無作為抽出」の記事については、「無作為抽出」の概要を参照ください。
- 系統抽出法のページへのリンク