標本調査
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/12/27 05:26 UTC 版)
抽出とデータ収集
データ収集には次のような注意が必要である。
- 既定の抽出過程に従って行う。
- データの時間順序を守る。
- 調査過程での注意点を記録する。
- 調査不能となった対象を記録する。
データ解析
伝統的な標本調査は、標本から中心極限定理と正規分布近似(場合によっては正規分布によらないノンパラメトリック推定も利用できる)を利用して、母集団と母数を推定することで行う。これは計画に基づく抽出といわれる。
現代的な方法としては、抽出過程からベイズ推定などを用いてモデルを作る、モデルに基づく抽出がある。この方法は標本サイズが小さいときに実用的であるが、モデルの前提の正しさを確認しておく必要がある。
標本の加重
層別抽出では、一般に標本として抽出される比率が層によって異なるので、データには正しく母集団を代表するように加重をしなければならない。
例えば社会調査で単純無作為抽出をするには、僻地の人も含めねばならないが、僻地の人にインタビューするにはコストがかかる。このコストを節約する方法として、都会と地方に層化する方法がある。地方の標本サイズが小さくなっても、分析で重みをつけることによって補うことができる。
抽出過程の再調査
抽出後の分析での変動が起こす影響を検討するために、(最初に意図した方法ではなく)実際に行った抽出過程について再調査する必要がある。特に問題となるのは、調査不能対象である。
調査不能者
特に人を対象とした社会調査で、標本とされた人が参加を拒否したり、連絡がつかなかったりすることがある。この場合、調査できた人と調査不能者との違いが、結果的に選抜の偏り(非確率的誤差)につながるおそれがあるので、しばしば追跡調査が必要になる。
- 標本調査のページへのリンク