推計統計学
(区間推定 から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/03/30 02:28 UTC 版)
推計統計学(すいけいとうけいがく、英: inferential statistics, inductive statistics)あるいは統計的推論(英: statistical inferenece)とは、母集団全体を知ることができない場合に、母集団から抽出された部分集団(抽出集団、標本集団)をもとに、確率論を用いて母集団の様子を推定する統計学の分野を言う。推計という語は、推定、推論、推測などと訳されることもある。
- ^ 渡辺. 統計的推測と学習. 東京工業大学.
- ^ 渡辺澄夫, 「学習理論の基礎概念」『計測と制御』 44巻 5号 2005年 p.293-298, doi:10.11499/sicejl1962.44.293, 計測自動制御学会。
- ^ 後藤正幸、「統計的モデル選択 - データが選ぶ良いモデルとは? (PDF) 」
- ^ 「将来観測されるであろうデータx*の分布を予測分布(predictive distribution)といいます」豊田秀樹. (2016). はじめての統計データ分析. p.38. 朝倉書店.
- ^ 「事後予測分布は『事後分布 f(θ|x)による統計モデルf(x*|θ)の平均』です。... これが母数によるモデル生成分布の平均です。」豊田秀樹. (2016). はじめての統計データ分析. p.38. 朝倉書店.
区間推定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/11/15 09:49 UTC 版)
実際に算出される工程能力指数の値は計測データに基づいた点推定値であり、得られた指数を前掲の表のような基準値と比較するだけでは不十分である。正しく評価するには区間推定を行う必要がある。 C ^ p {\displaystyle {\hat {C}}_{p}} については以下の方法で、両側信頼区間や推定に必要なデータ数を求めることができる。工程能力指数の他の定義についても、同様の研究がある。 信頼水準1-αでの両側信頼区間は次式で与えられる。ここでφ=n-1でnは計測データ数。 ( C ^ p { χ 2 ( 1 − α / 2 ; ϕ ) / ϕ } 1 2 , C ^ p { χ 2 ( α / 2 ; ϕ ) / ϕ } 1 2 ) {\displaystyle {\Big (}{\hat {C}}_{p}\left\{\chi ^{2}(1-\alpha /2;\phi )/\phi \right\}^{\frac {1}{2}},{\hat {C}}_{p}\left\{\chi ^{2}(\alpha /2;\phi )/\phi \right\}^{\frac {1}{2}}{\Big )}} これは、φs2/σ2 が自由度φのχ2分布に従うことで次式が成立することによる(sは標本標準偏差)。 P r { χ 2 ( 1 − α / 2 ; ϕ ) ≦ ϕ s 2 / σ 2 ≦ χ 2 ( α / 2 ; ϕ ) } = 1 − α {\displaystyle Pr\left\{\chi ^{2}(1-\alpha /2;\phi )\leqq \phi s^{2}/\sigma ^{2}\leqq \chi ^{2}(\alpha /2;\phi )\right\}=1-\alpha } ある区間幅で推定するのに必要なデータ数については、区間幅2δに対して次の近似式が知られている。ここで、u(α)は標準正規分布N(0,12)の両側100α点である。 C ^ p 2 u ( α ) 2 2 δ 2 + 1 ≦ n {\displaystyle {\frac {{{\hat {C}}_{p}}^{2}u(\alpha )^{2}}{2\delta ^{2}}}+1\leqq n} 目安として信頼水準0.95における必要データ数を表3に示す。 表3 信頼水準0.95において区間幅2δで推定するために必要なデータ数 C ^ p {\displaystyle {\hat {C}}_{p}} δ0.200.150.100.050.7 24.5 42.8 95.1 377.5 1.0 49.0 86.4 193.1 769.3 1.3 82.2 145.3 325.6 1299.5 1.5 109.0 193.1 433.2 1729.7 2.0 193.1 342.5 769.3 3074.3
※この「区間推定」の解説は、「工程能力指数」の解説の一部です。
「区間推定」を含む「工程能力指数」の記事については、「工程能力指数」の概要を参照ください。
区間推定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/28 18:39 UTC 版)
点推定で推定したパラメータのバラツキや信頼区間を示すこと。 正規分布の場合には標準誤差 (Standard Error, SE) を用いることが多い。平均値の標準誤差を特に SEM (standard error of the mean) と呼ぶ。SEMは以下の式で算出される。 S E M = ∑ i = 1 n ( x i − μ ^ ) 2 n ( n − 1 ) {\displaystyle SEM={\sqrt {\frac {\sum \limits _{i=1}^{n}(x_{i}-{\hat {\mu }})^{2}}{n(n-1)}}}} また、より具体的に信頼区間(95%信頼区間、99%信頼区間などが用いられる)を表示することもある。
※この「区間推定」の解説は、「推計統計学」の解説の一部です。
「区間推定」を含む「推計統計学」の記事については、「推計統計学」の概要を参照ください。
- 区間推定のページへのリンク