第一種過誤と第二種過誤
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/10/31 00:06 UTC 版)
第一種過誤(だいいっしゅかご、英: Type I error)と第二種過誤(だいにしゅかご、英: Type II error)は、仮説検定において過誤を表す統計学用語である。第一種過誤を偽陽性(ぎようせい、英: False positive[1])、α過誤(α error)、あわてものの誤り[2]ともいう。第二種過誤を偽陰性(ぎいんせい、英: False negative[3])、β過誤(β error)、ぼんやりものの誤り[2]ともいう。なお「過誤」とは、誤差によって二項分類などの分類を間違うことを意味する。
統計的過誤と系統過誤
過誤は次の2種類がある[注釈 1]。
- 統計的過誤(Statistical error)
- 計算や計測で得られた値と真の理論上の値との誤差が、無作為で本質的に予測不可能な変動によって生じている場合[注釈 2]。
- 系統過誤(Systematic error)
- 計算や計測で得られた値と真の理論上の値との誤差が、未知のソースによる無作為でない影響であり(不確かさ参照)、そのソースが特定されれば排除できる[注釈 2]。
統計的過誤: 第一種と第二種
統計学において、証拠を無に帰するような「帰無仮説」を置いて検証を進める。帰無仮説の例には、「個人は病気ではない」とか、「被告人は無実である」とか、「潜在的なログイン対象が認可されていない」などが挙げられる。
一方で、帰無仮説と全く逆の状況に対応する「対立仮説」がある(こちらが証明したい事象に対応する)。すなわち、「個人が病気にかかっている」とか、「被告人が有罪である」とか、「ログイン対象が許可されたユーザである」といったことを表す。
目標は、偽である帰無仮説が棄却されて真である対立仮説が採用されることである。ある種のテスト(血液検査、裁判、ログイン試み)を実施し、データを得る。
テストの結果は、陰性かもしれない(つまり、病気でない、有罪でない、ログインが許されない)。一方、それは陽性かもしれない(つまり、病気、有罪、ログイン成功)。
テストの結果と実際の状態が一致していないなら過誤が発生したことになる。テストの結果と実際の状態が一致しているなら、判断は正しいことになる。どちらの仮説を誤って採用してしまったかによって、過誤を「第一種過誤」と「第二種過誤」に分類する。
第一種過誤
第一種過誤(α過誤、偽陽性)は、帰無仮説が実際には真であるのに棄却してしまう過誤である。つまり、偽がヒットすることによるエラーである。先ほどの例で言えば「個人は病気ではない」のにもかかわらず「個人が病気である」と判断してしまうことに相当する。
第二種過誤
第二種過誤(β過誤、偽陰性)は、対立仮説が実際には真であるのに帰無仮説を採択してしまう過誤である。つまり、真が抜け落ちることによるエラーである。対立仮説が正しい時に対立仮説を採択しない誤りのこと。先ほどの例で言えば「個人が病気である」のに「個人は病気でない」と判断してしまう事に相当する。
過誤の具体例
「真犯人を逮捕すること」を「帰無仮説を棄却すること」に例える。第一種過誤は「一般市民を冤罪で逮捕してしまうこと」である。第二種過誤は「真犯人を取り逃がすこと」を意味している。
刑事訴訟法336条で、「被告事件が罪とならないとき、又は被告事件について犯罪の証明がないときは、判決で無罪の言渡をしなければならない」と定めている。これは疑わしきは罰せずとも言う。第一種過誤を避けるような手法を採用することを推奨している[4]。他の分類については後述の過誤種別拡張の提案を参照されたい。
解説
仮説検定は、2つの標本の分布の違いが無作為な偶然性で説明できるかどうかを判定する技法である。2つの分布に有意な差があると結論付ける場合、その差異が無作為な偶然性では説明できないことを十分注意して判断する必要がある。真ではない仮説を採用する可能性をなるべく小さくするよう注意を払わなければならない。一般に第一種過誤となる確率を .05 か .01 に設定する。これはつまり100例のうち5例か1例で過誤が発生することを意味する。これを「有意水準」と呼ぶ。100例のうち5例というのが十分かどうかは一概には言えないため、有意水準の選択には細心の注意が必要である。例えば、シックス・シグマの品質管理を採用する工場では標準偏差の6倍の幅(±6σ)を管理限界とする(これを外れるのは極めて珍しい)。
統計的手法の利点は無作為な標本抽出にある。つまり、2つの分布の差が治療の前後でどう変化するかを無作為抽出で追跡可能である。しかし、現実がそれほど単純でないのは明らかである。無作為標本を取り出したとき、全く同じ分布となる可能性は極めて小さい。たとえ同じ分布であったとしても、それが偶然の産物なのか、それとも常にそうなるのかは判断できない。
語源
1928年、著名な統計学者のイェジ・ネイマン(1894年 - 1981年)とエゴン・ピアソン(1895年 - 1980年)は「特定の標本が、ある個体群から無作為に選ばれたと判断できるかどうかの判定」という問題を議論した[5]。そして、Davidは「'無作為な'という形容詞は標本の抽出方法に対するもので、標本そのものにかかるのではない」と指摘した[6]。
彼らは「過誤の2つの源泉」を次のように表した:
- (a) 採択すべき仮説を棄却する過誤
- (b) 棄却すべき仮説を採択する過誤[7]
1930年、彼らは「過誤の2つの源泉」の概念を次のように練り直した:
…仮説検定では次の2点を常に考慮しなければならない。 (1) 我々は、真の仮説を棄却してしまう可能性を必要に応じて低く抑えることができなければならない。 (2) 偽と思われる仮説が棄却されるような検定でなければならない。 [8]
1933年、彼らはこれらの「問題は、仮説の真偽が確信を持って断言できるような場合には存在しない」と述べた[9]。彼らはまた、「対立仮説群」[10]から特定の仮説を棄却または採用する決定において、過誤が容易に発生するとした。
…(そして)それらの過誤は以下の2種類に分けられる:
- (I) Ho(すなわち検定対象の仮説)が真であるのに棄却する。
- (II) 代替の仮説 Hi が真であるのに Ho を採択した[9]。
ネイマンとピアソンの共同執筆論文では、Ho が常に「検定対象仮説」を表[11]。添え字は "O" であってゼロではない(「オリジナル」の意)。
同じ論文[12]で、彼らは「2つの過誤の源泉」を第一種の過誤(errors of type I)および第二種の過誤(errors of type II)と呼んでいる[注釈 3]。
統計学的扱い
定義
第一種過誤と第二種過誤
ネイマンとピアソンによる過誤の定義は広く採用され、第一種過誤と第二種過誤として知られている。また、分かりやすさから、これらをそれぞれ偽陽性と偽陰性とも呼ぶことが多い。これらの用語は本来の定義から拡大解釈され、様々な場面で使われるようになっている。例えば、
- 第一種過誤(偽陽性): 受諾(受理)されるべき帰無仮説を拒絶(却下)する過誤。例えば、無実の人物を有罪にすること。
- 第二種過誤(偽陰性): 拒絶(却下)されるべき帰無仮説を受諾(受理)する過誤。例えば、真犯人を無罪にすること。
上の例は、この拡大された定義での曖昧さを示している。ここでは「無罪であること」を中心に考えているが、当然ながら「有罪であること」を中心に考えることもできる。以下の表で条件を示す。
実際の状態 | |||
有 | 無 | ||
テスト 結果 |
陽性 | 状態「有」 + 結果「陽性」 = 真陽性 (true positive, TP) |
状態「無」 + 結果「陽性」 = 偽陽性 (false positive, FP) 第一種過誤 |
陰性 | 状態「有」 + 結果「陰性」 = 偽陰性 (false negative, FN) 第二種過誤 |
状態「無」 + 結果「陰性」 = 真陰性 (true negative, TN) |
妊娠検査の例を示す。
実際の状態 | |||
妊娠している | 妊娠していない | ||
検査 結果 |
妊娠している | 真陽性 | 偽陽性 (妊娠しているという検査結果だが、 実際には妊娠していない) 第一種過誤 |
妊娠していない | 偽陰性 (妊娠しているのに 検出できなかった) 第二種過誤 |
真陰性 |
ここで、検査結果が「真」や「偽」といった場合、2種類の意味があることに注意する。実際の状態(条件)では、真 = 有(ある属性が有る)と、偽 = 無(ある属性が無い)であり、検査結果の正確性においては、真陽性/偽陽性/真陰性/偽陰性という使われ方をする。上の表ではこの混同を避けるため、状態については「有/無」で表している。
偽陽性率・第一種過誤
偽陽性率 カテゴリ
Weblioに収録されているすべての辞書から第一種過誤と第二種過誤を検索する場合は、下記のリンクをクリックしてください。

- 第一種過誤と第二種過誤のページへのリンク