基本概念と用語
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/05/18 15:02 UTC 版)
分散分析は,実験データの解析に多用される統計的仮説検定の一形態である。帰無仮説が正しいと仮定して、帰無仮説と標本から計算された検定結果が、偶然に発生した可能性が低いと判断される場合、”統計的に有意”と呼ばれる。帰無仮説の発生確率が低い場合、確率(P値)が事前に指定されたしきい値(有意水準)よりも小さい場合、統計的に有意な結果によって帰無仮説は棄却される。 分散分析の典型的な使い方は、「すべてのグループが同じ母集団からのランダムなサンプルである」という帰無仮説である。たとえば,患者の類似したサンプルに対する異なる治療法の効果を研究するとき,帰無仮説を「すべての治療法が同じ効果を持つ(何も起こらないという結果になる)」とする。帰無仮説を棄却されると、「治療グループ間で観察された効果の違いが、無作為な偶然によるものである可能性が低い(=効果の違いは治療に原因がある)」ことを意味する。 仮説検定では、第一種の過誤(偽陽性)の発生率を有意水準に制限する。実験者は,第二種の過誤(偽陰性)も制限したいと考える。第二種の過誤の発生率は、サンプルサイズ、有意水準、効果量に大きく依存する。(サンプルが小さいほど発生率は大きくなる。有意水準が高いと、差異を見落とす可能性も高くなる。効果量が小さいほど第2種エラーが発生しやすくなる。) 分散分析の用語は、多くが実験計画法に由来する。実験者は、効果を決定するために、要因を調整し反応を測定する。結果の妥当性を保証するために,ランダム化とブロッキングの組み合わせによって因子は実験ユニットに割り当てられる。また実験対象によっては盲検化を行い、結果の公平性を確保する。応答は、効果による偏りとランダムなエラーの複合で変動する。 分散分析は、いくつかのアイデアの合成であり、多くの目的に使用され,簡潔または正確に定義することは困難である。 バランスのとれたデータのための "古典的 "分散分析は、次の3つを同時に行う。 1.探索的データ分析として、分散分析は加法的データ分解を採用し、その二乗和は分解の各成分(または同等に、線形モデルの各項のセット)の分散を示す。2.平均二乗の比較とF検定により、モデルの入れ子構造を検証することができる。3.係数推定値と標準誤差を伴う線形モデルのフィッティングに密接に関連する。
※この「基本概念と用語」の解説は、「分散分析」の解説の一部です。
「基本概念と用語」を含む「分散分析」の記事については、「分散分析」の概要を参照ください。
- 基本概念と用語のページへのリンク