p値
p値
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/07/16 09:48 UTC 版)
帰無仮説の有意性検定において、p値(ピーち、p-value[注 1])は、帰無仮説が正しいという仮定の下で、実際に観察された結果と少なくとも同じくらい極端な検定結果を得る確率である[2][3]。p値が非常に小さいことは、そのような極端な観測結果は帰無仮説の下では極めて起こりにくいことを意味する。多くの定量的な分野の学術出版物では、統計的検定の p値が一般的に報告されているにもかかわらず、p値の誤った解釈や p値の誤用が広く見られ、数学やメタサイエンスの主要な課題となっている[4][5]。2016年、アメリカ統計学会(ASA)は正式な声明を発表し、「p値は、研究対象となった仮説が正しい確率や、データが偶然だけで生じた確率を測定するものではない」と述べ、「p値、すなわち統計的有意性は、効果の大きさや結果の重要性を測定するものではない」または「モデルや仮説に関する証拠」ではないとした[6]。しかし、ASAのタスクフォースは2019年に、統計的有意性と再現性に関する声明を発表し、「p値および有意性検定は、適切に用いられ解釈された場合、データから導き出される結論の厳密性を高めることができる」と結論づけている[7]。
注釈
- ^ 用語のイタリック体、大文字、ハイフンの使用法はさまざまである。たとえば、AMAスタイルでは"P value"、APAスタイルでは"p value"、アメリカ統計学会(ASA)では"p-value"と表記する。いずれの場合も「p」は確率(probability)を表す。[1]
- ^ 結果の統計的有意性は、結果が現実世界でも当てはまることを意味するわけではない。たとえば、ある薬が統計的に有意な効果を持っていたとしても、その効果が小さすぎて意味がないこともある。
- ^ より具体的に言えば、p = 0.05 は正規分布(両側検定)の場合、約 1.96 標準偏差に相当し、2標準偏差は偶然に超える可能性が約 1/22、つまり p ≈ 0.045 に相当する。フィッシャーはこれらの近似値について言及している。
出典
- ^ “ASA House Style”. Amstat News. American Statistical Association. 2022年2月5日閲覧。
- ^ Aschwanden C (2015年11月24日). “Not Even Scientists Can Easily Explain P-values”. FiveThirtyEight. 2019年9月25日時点のオリジナルよりアーカイブ。2019年10月11日閲覧。
- ^ a b c d e Wasserstein RL; Lazar NA (7 March 2016). “The ASA's Statement on p-Values: Context, Process, and Purpose”. The American Statistician 70 (2): 129–133. doi:10.1080/00031305.2016.1154108.
- ^ Hubbard R; Lindsay RM (2008). “Why P Values Are Not a Useful Measure of Evidence in Statistical Significance Testing”. Theory & Psychology 18 (1): 69–88. doi:10.1177/0959354307086923.
- ^ Munafò MR; Nosek BA; Bishop DV; Button KS; Chambers CD; du Sert NP et al. (January 2017). “A manifesto for reproducible science”. Nature Human Behaviour 1 (1): 0021. doi:10.1038/s41562-016-0021. PMC 7610724. PMID 33954258 .
- ^ Wasserstein, Ronald L.; Lazar, Nicole A. (2016-04-02). “The ASA Statement on p -Values: Context, Process, and Purpose” (英語). The American Statistician 70 (2): 129–133. doi:10.1080/00031305.2016.1154108. ISSN 0003-1305.
- ^ a b Benjamini, Yoav; De Veaux, Richard D.; Efron, Bradley; Evans, Scott; Glickman, Mark; Graubard, Barry I.; He, Xuming; Meng, Xiao-Li et al. (2021-10-02). “ASA President's Task Force Statement on Statistical Significance and Replicability”. Chance (Informa UK Limited) 34 (4): 10–11. doi:10.1080/09332480.2021.2003631. ISSN 0933-2480.
- ^ Neyman, Jerzy (1976). “The Emergence of Mathematical Statistics: A Historical Sketch with Particular Reference to the United States”. In Owen, D.B.. On the History of Statistics and Probability. Textbooks and Monographs. New York: Marcel Dekker Inc. p. 161
- ^ Benjamin, Daniel J.; Berger, James O.; Johannesson, Magnus; Nosek, Brian A.; Wagenmakers, E.-J.; Berk, Richard; Bollen, Kenneth A.; Brembs, Björn et al. (1 September 2017). “Redefine statistical significance”. Nature Human Behaviour 2 (1): 6–10. doi:10.1038/s41562-017-0189-z. hdl:10281/184094. PMID 30980045.
- ^ a b Head ML; Holman L; Lanfear R; Kahn AT; Jennions MD (March 2015). “The extent and consequences of p-hacking in science”. PLOS Biology 13 (3): e1002106. doi:10.1371/journal.pbio.1002106. PMC 4359000. PMID 25768323 .
- ^ Simonsohn U; Nelson LD; Simmons JP (November 2014). “p-Curve and Effect Size: Correcting for Publication Bias Using Only Significant Results”. Perspectives on Psychological Science 9 (6): 666–681. doi:10.1177/1745691614553988. PMID 26186117.
- ^ Bhattacharya B; Habtzghi D (2002). “Median of the p value under the alternative hypothesis”. The American Statistician 56 (3): 202–6. doi:10.1198/000313002146.
- ^ Hung HM; O'Neill RT; Bauer P; Köhne K (March 1997). “The behavior of the P-value when the alternative hypothesis is true”. Biometrics 53 (1): 11–22. doi:10.2307/2533093. JSTOR 2533093. PMID 9147587 .
- ^ Nuzzo R (February 2014). “Scientific method: statistical errors”. Nature 506 (7487): 150–152. Bibcode: 2014Natur.506..150N. doi:10.1038/506150a. PMID 24522584.
- ^ Colquhoun D (November 2014). “An investigation of the false discovery rate and the misinterpretation of p-values”. Royal Society Open Science 1 (3): 140216. arXiv:1407.5296. Bibcode: 2014RSOS....140216C. doi:10.1098/rsos.140216. PMC 4448847. PMID 26064558 .
- ^ Lee DK (December 2016). “Alternatives to P value: confidence interval and effect size”. Korean Journal of Anesthesiology 69 (6): 555–562. doi:10.4097/kjae.2016.69.6.555. PMC 5133225. PMID 27924194 .
- ^ Ranstam J (August 2012). “Why the P-value culture is bad and confidence intervals a better alternative”. Osteoarthritis and Cartilage 20 (8): 805–808. doi:10.1016/j.joca.2012.04.001. PMID 22503814.
- ^ Perneger TV (May 2001). “Sifting the evidence. Likelihood ratios are alternatives to P values”. BMJ 322 (7295): 1184–1185. doi:10.1136/bmj.322.7295.1184. PMC 1120301. PMID 11379590 .
- ^ Royall R (2004). “The Likelihood Paradigm for Statistical Evidence” (英語). The Nature of Scientific Evidence. pp. 119–152. doi:10.7208/chicago/9780226789583.003.0005. ISBN 9780226789576
- ^ Schimmack U (2015年4月30日). “Replacing p-values with Bayes-Factors: A Miracle Cure for the Replicability Crisis in Psychological Science”. Replicability-Index. 2017年3月7日閲覧。
- ^ Marden JI (December 2000). “Hypothesis Testing: From p Values to Bayes Factors”. Journal of the American Statistical Association 95 (452): 1316–1320. doi:10.2307/2669779. JSTOR 2669779.
- ^ Stern HS (16 February 2016). “A Test by Any Other Name: P Values, Bayes Factors, and Statistical Inference”. Multivariate Behavioral Research 51 (1): 23–29. doi:10.1080/00273171.2015.1099032. PMC 4809350. PMID 26881954 .
- ^ Murtaugh PA (March 2014). “In defense of P values”. Ecology 95 (3): 611–617. Bibcode: 2014Ecol...95..611M. doi:10.1890/13-0590.1. PMID 24804441 .
- ^ Aschwanden C (2016年3月7日). “Statisticians Found One Thing They Can Agree On: It's Time To Stop Misusing P-Values”. FiveThirtyEight. 2016年3月9日閲覧。
- ^ Amrhein V; Korner-Nievergelt F; Roth T (2017). “The earth is flat (p > 0.05): significance thresholds and the crisis of unreplicable research”. PeerJ 5: e3544. doi:10.7717/peerj.3544. PMC 5502092. PMID 28698825 .
- ^ Amrhein V; Greenland S (January 2018). “Remove, rather than redefine, statistical significance”. Nature Human Behaviour 2 (1): 4. doi:10.1038/s41562-017-0224-0. PMID 30980046.
- ^ Colquhoun D (December 2017). “The reproducibility of research and the misinterpretation of p-values”. Royal Society Open Science 4 (12): 171085. doi:10.1098/rsos.171085. PMC 5750014. PMID 29308247 .
- ^ Brian E; Jaisson M (2007). “Physico-Theology and Mathematics (1710–1794)”. The Descent of Human Sex Ratio at Birth. Springer Science & Business Media. pp. 1–25. ISBN 978-1-4020-6036-6
- ^ Arbuthnot J (1710). “An argument for Divine Providence, taken from the constant regularity observed in the births of both sexes”. Philosophical Transactions of the Royal Society of London 27 (325–336): 186–190. doi:10.1098/rstl.1710.0011 .
- ^ a b Conover WJ (1999). “Chapter 3.4: The Sign Test”. Practical Nonparametric Statistics (Third ed.). Wiley. pp. 157–176. ISBN 978-0-471-16068-7
- ^ Sprent P (1989). Applied Nonparametric Statistical Methods (Second ed.). Chapman & Hall. ISBN 978-0-412-44980-2
- ^ Stigler SM (1986). The History of Statistics: The Measurement of Uncertainty Before 1900. Harvard University Press. pp. 225–226. ISBN 978-0-67440341-3
- ^ Bellhouse P (2001). “John Arbuthnot”. Statisticians of the Centuries. Springer. pp. 39–42. ISBN 978-0-387-95329-8
- ^ Hald A (1998). “Chapter 4. Chance or Design: Tests of Significance”. A History of Mathematical Statistics from 1750 to 1930. Wiley. pp. 65
- ^ Stigler SM (1986). The History of Statistics: The Measurement of Uncertainty Before 1900. Harvard University Press. p. 134. ISBN 978-0-67440341-3
- ^ Pearson K (1900). “On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling”. Philosophical Magazine. Series 5 50 (302): 157–175. doi:10.1080/14786440009463897 .
- ^ Biau, David Jean; Jolles, Brigitte M.; Porcher, Raphaël (2010). “P Value and the Theory of Hypothesis Testing: An Explanation for New Researchers”. Clinical Orthopaedics and Related Research 468 (3): 885–892. doi:10.1007/s11999-009-1164-4. ISSN 0009-921X. PMC 2816758. PMID 19921345 .
- ^ Brereton, Richard G. (2021). “P values and multivariate distributions: Non-orthogonal terms in regression models” (英語). Chemometrics and Intelligent Laboratory Systems 210: 104264. doi:10.1016/j.chemolab.2021.104264 .
- ^ Hubbard R; Bayarri MJ (2003), “Confusion Over Measures of Evidence (p′s) Versus Errors (α′s) in Classical Statistical Testing”, The American Statistician 57 (3): 171–178 [p. 171], doi:10.1198/0003130031856
- ^ Fisher 1925, p. 47, Chapter III. Distributions.
- ^ a b Dallal 2012, Note 31: Why P=0.05?.
- ^ Fisher 1925, pp. 78–79, 98, Chapter IV. Tests of Goodness of Fit, Independence and Homogeneity; with Table of χ2, Table III. Table of χ2.
- ^ Fisher 1971, II. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment.
- ^ a b Fisher 1971, Section 7. The Test of Significance.
- ^ Fisher 1971, Section 12.1 Scientific Inference and Acceptance Procedures.
- ^ “Definition of E-value”. National Institutes of Health. 2010年5月17日閲覧。
- ^ Storey JD (2003). “The positive false discovery rate: a Bayesian interpretation and the q-value”. The Annals of Statistics 31 (6): 2013–2035. doi:10.1214/aos/1074290335.
- ^ Storey JD; Tibshirani R (August 2003). “Statistical significance for genomewide studies”. Proceedings of the National Academy of Sciences of the United States of America 100 (16): 9440–9445. Bibcode: 2003PNAS..100.9440S. doi:10.1073/pnas.1530509100. PMC 170937. PMID 12883005 .
- ^ Makowski D; Ben-Shachar MS; Chen SH; Lüdecke D (10 December 2019). “Indices of Effect Existence and Significance in the Bayesian Framework”. Frontiers in Psychology 10: 2767. doi:10.3389/fpsyg.2019.02767. PMC 6914840. PMID 31920819 .
- ^ An Introduction to Second-Generation p-Values Jeffrey D. Blume, Robert A. Greevy, Valerie F. Welty, Jeffrey R. Smith &William D. Dupont https://www.tandfonline.com/doi/full/10.1080/00031305.2018.1537893
P値
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/19 20:00 UTC 版)
帰無仮説の下で実際にデータから計算された統計量よりも極端な(仮説に反する)統計量が観測される確率を、P値という。P値の利用に伴う諸問題を考慮した社会心理学系のジャーナル、Basic and Applied Social Psychology(英語版)(BASP)は、帰無仮説有意性検定およびそれに類する統計学的処理を禁止すると発表した。
※この「P値」の解説は、「有意」の解説の一部です。
「P値」を含む「有意」の記事については、「有意」の概要を参照ください。
「P 値」の例文・使い方・用例・文例
- 米国のCongressは英国のParliamentに相当する
- LP盤
- 辞書でPHの項を引いてごらん
- また、明日は休みを取ると思うので、その場合はあなたにPutnam自動車のLyle氏に朝一番で電話をかけて、11:00 の訪問の予定を延期してもらいたいです。
- 家庭用品小売業のPatio社は昨日、住宅設計と建設事業へ参入することを発表した。
- Patio社は、外国で作られた家庭用品や家具、装飾用品を輸入する小さな貿易会社として20 年前に創業した。
- 同社には、都会の環境に田舎の生活を取り入れたいと思う中流階級の都会人の間に数多くの支持者がおり、最高経営責任者のByron Coxによると、「住宅設計や建設は弊社のような企業にとって当然の結果だ。弊社のお客様は、彼らが所有するPatioの商品と調和する建物を求めている」とのことだ。
- Patio初の主要な建設プロジェクトはGolden Bayを見下ろす20戸の分譲マンションになるだろう。
- 今年の1 月まで、「Premiumアイスクリーム」で知られるErnesto Dairyの副社長だったCarla Starkが、4 月20 日付けでHolman Health社の会長に就任することが今日発表された。
- Holman Healthの株主は、StarkがErnestoに行ったのと同じ魔法をかけてくれることを大いに期待していると報じられている。Starkは、Ernestoがグルメアイス市場において驚くべき20%というシェアを獲得することになった「Premiumアイスクリーム」のブランドを作り上げた人物である。
- Colby KentがHeidi Petersに連絡をした理由
- Pennbrook社が販売している商品の種類
- 11月21日にHolyoke Bar and Grillで、Pete Laurenの退職パーティーが開かれることをお知らせします。11 月10 日までにお返事をください。
- 食事は午後6時から7時の間に出され、そのあとでPeteが20 年に及ぶ勤務の中で会社に多大な貢献をしてくれたことを称える短いセレモニーを行います。
- 会社からPeteに記念の盾と退職記念品が贈られますが、素晴らしい指導者であり手本となってくれたPeteに、私たち全員から贈り物をするために寄付を募ります。
- 開会の辞:Dotty Powers(議長)が午後6 時30 分に会議を開始し、新会計係のClaire Hudsonを紹介した。
- ビルの改修:建設委員会のPetit 氏は、裏口のスロープの工事が予定通り1 月10 日に始まると報告した。
- さまざまな事業:Powersさんは、センターの青少年バスケットボールプログラムがBrookville Inquirer の記事内で最近、賞賛されたと知らせた。
- 会議は、Powersさんによって午後7時30分に一時休会とされた。
- 技術部のPhil Powersが、先週後半に異動の辞令を受け、来月末にDunkirk工場へ転勤することになりました。
- >> 「P値」を含む用語の索引
- P値のページへのリンク