被操纵的P值:科学论文中的数学胡扯丨展卷(6)
2023-05-20 来源:飞速影视
这种混淆(以为病人有95%的概率被感染,而实际上不到2%) 应该是一个常见的错误。这其实是我们的“老朋友”检察官谬误,不过它换了一种表现形式。我们有时称其为基率谬误,因为在解释测试结果时,忽略了群体中患这种疾病的基础比率。
如果测试的是一种非常常见的情况,那么基率谬误不是什么大问题。假设你在为一位来自美国上中西部地区的年轻白人女性治疗胃病时,决定检查她是否有幽门螺杆菌感染。幽门螺杆菌是一种与消化性溃疡有关的胃病病原体。与莱姆病的抗体检测一样,约5%未感染者的尿素呼气试验结果呈阳性。如果你的病人检测呈阳性,那么她携带幽门螺杆菌的可能性有多大呢?也是1/50 吗?不对,这次的可能性要大得多,因为幽门螺杆菌是一种常见病原体。在美国,大约20%的白种人携带幽门螺杆菌。假设有1万人接受这种病原体的检测,那么你会看到大约2000个真阳性结果,剩下的8000人中,这个概率大约为5%,也就是大约400人会得到假阳性结果。因此,在幽门螺杆菌检测呈阳性的美国白种人中,大约5/6 的人真的携带这种病菌。
发表偏倚
说完这些,我们继续讨论约阿尼迪斯的观点。在“为什么发表的研究成果大多是虚假的”这篇论文中,约阿尼迪斯对科学研究和医学检测结果解释进行了类比。他认为,由于发表偏倚,大多数阴性研究结果都没有发表,因此我们在文献中看到的大多是阳性结果。如果科学家测试的是不可能的假设,那么大多数阳性结果应该都是假阳性,这就好像莱姆病检测结果——如果没有其他风险因素,阳性检测结果大多是假阳性。
没错儿,约阿尼迪斯就是这样想的。他的数学计算无可争论。从他的模型来看,他的结论也是正确的。他还可以从我们之前讨论过的论文中得到一定的经验支持:那些论文表明,许多发表在优秀期刊上的实验是无法复证的。如果这些实验的许多阳性结果都是假阳性,就正好符合我们的预料。
值得商榷的是约阿尼迪斯的假设。要使大多数发表的成果都是错误的,科学实验就必须像罕见疾病一样:极不可能产生真阳性结果。但科学与罕见疾病不同,因为科学家可以选择他们想要验证的假设。我们已经看到,科学家很好地适应了所在专业领域的酬偿结构:获得酬劳的主要途径是发表有意义的研究成果,而阴性结果很难发表。因此,我们可以预料科学家测试的假设虽然尚未确定,但有合理的可能性是成立的。这让我们想到幽门螺杆菌的例子,大多数的阳性结果都是真阳性。约阿尼迪斯是过于悲观了,因为他对研究人员决定检验的各种假设做出了不符合实情的假设。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号