信頼区間 confidence interval
信頼区間
母集団母数(パラメーター) 1は母集団を特徴づける数値である。統計的推定 2とはそのような母数を標本から推定する手続をいう。このような推定値は標本誤差 3の影響を受け、標本誤差の大きさの程度は一般的に標準誤差 4によって与えられる。時に信頼区間 5という用語が用いられ、あらかじめ定められた確率の下で推定値がその中に落ちると期待される範囲を示す。二つの数値の差が偶然によって生ずる確率が、有意水準 7と呼ばれる所与の数値より小さい場合、その差は有意差 6と呼ばれる。たとえば、偶然によって生じる確率が0.05未満の場合、その差は5%水準で有意であるという。標本誤差に加えて、観測誤差 8あるいは回答誤差 8も推定値に影響を与える。これらの誤差には通常、面接誤差 9が含まれるが、それは基礎データが収集される際に面接調査員によってもたらされる系統的誤差である。
信頼区間
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/04/09 15:34 UTC 版)
![]() | この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。(2015年9月) |
![]() | この記事は英語版の対応するページを翻訳することにより充実させることができます。(2024年5月) 翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。
|

信頼区間(しんらいくかん、英: Confidence interval, CI)とは、統計学で母集団の真の値(母平均等)が含まれることが、かなり確信 (confident) できる数値範囲のことである[1]。例えば95%CIとは、信頼区間を計算するために用いた数学的モデルが有意水準α = 0.05の仮説検定で棄却されないパラメーターの範囲を指す[2]。真の値は未測定であっても確率変数ではなく、特定の区間に含まれるか含まれないかは確定している。
数学的には、母数空間 Θ 上の関数 g: Θ → R が母数 θ ∈ Θ でとる値 g(θ) を統計的に推定するために用いられる区間をいう。実数 0 < α < 1 と(観測できない)母数 θ により定まる確率分布 P = Pθ をもつ母集団からの標本 X1, …, Xn に関する統計量 a, b が不等式
95%信頼区間の例。50の信頼区間のうち3つには母平均μが含まれていない。 上の言い方は「候補Aの支持率が35%から45%である確率は95%である」 というふうにとられやすいが、これは(少なくとも従来の統計学の主流的考え方としては)誤解である。
別の例として、観測値から海王星の質量を推定する場合を以下に記す。
1.「信頼水準90%で、海王星の質量は a から b の間である」
とは言えるが、観測から得られた値 a と b に基づいて
2.「海王星の質量が a から b の間に入る確率は90%である」
と言うことはできない。質量はあくまで定数であって、誤差が生じるのは観測による、つまり a と b が誤差を含む統計量だからである。従来の統計学(確率を頻度として定義する頻度主義統計学)の考え方では海王星の例(1)を言い直せば、
1'. 「同じ測定を10回行えば、9回程度の頻度(割合)で『海王星の質量は a から b の間である』という測定結果が得られる」
ということになる。
ただし、確率を信頼の度合いとして定義するベイズ統計学の考え方では、2のような言い方は必ずしも誤りではない。この場合、普通用いられる考え方はベイズ信用区間(Bayesian credible interval)である。これはまず θ の値として予想される事前確率分布から出発して、次に観測データが与えられた条件での θ の条件付確率分布を求め、これを事後確率分布として“信頼”区間の表現に用いる方法である。
具体例
X1, …, Xn を、平均 μ、分散 σ2 > 0 の正規分布に従う母集団から抽出した独立な標本とする。そこで標本平均と不偏分散をそれぞれ