当前位置：首页 > 资讯 >

被操纵的P值：科学论文中的数学胡扯丨展卷(6)

2023-05-20 来源:飞速影视

这种混淆（以为病人有95%的概率被感染，而实际上不到2%）应该是一个常见的错误。这其实是我们的“老朋友”检察官谬误，不过它换了一种表现形式。我们有时称其为基率谬误，因为在解释测试结果时，忽略了群体中患这种疾病的基础比率。
如果测试的是一种非常常见的情况，那么基率谬误不是什么大问题。假设你在为一位来自美国上中西部地区的年轻白人女性治疗胃病时，决定检查她是否有幽门螺杆菌感染。幽门螺杆菌是一种与消化性溃疡有关的胃病病原体。与莱姆病的抗体检测一样，约5%未感染者的尿素呼气试验结果呈阳性。如果你的病人检测呈阳性，那么她携带幽门螺杆菌的可能性有多大呢？也是1/50 吗？不对，这次的可能性要大得多，因为幽门螺杆菌是一种常见病原体。在美国，大约20%的白种人携带幽门螺杆菌。假设有1万人接受这种病原体的检测，那么你会看到大约2000个真阳性结果，剩下的8000人中，这个概率大约为5%，也就是大约400人会得到假阳性结果。因此，在幽门螺杆菌检测呈阳性的美国白种人中，大约5/6 的人真的携带这种病菌。
发表偏倚
说完这些，我们继续讨论约阿尼迪斯的观点。在“为什么发表的研究成果大多是虚假的”这篇论文中，约阿尼迪斯对科学研究和医学检测结果解释进行了类比。他认为，由于发表偏倚，大多数阴性研究结果都没有发表，因此我们在文献中看到的大多是阳性结果。如果科学家测试的是不可能的假设，那么大多数阳性结果应该都是假阳性，这就好像莱姆病检测结果——如果没有其他风险因素，阳性检测结果大多是假阳性。
没错儿，约阿尼迪斯就是这样想的。他的数学计算无可争论。从他的模型来看，他的结论也是正确的。他还可以从我们之前讨论过的论文中得到一定的经验支持：那些论文表明，许多发表在优秀期刊上的实验是无法复证的。如果这些实验的许多阳性结果都是假阳性，就正好符合我们的预料。
值得商榷的是约阿尼迪斯的假设。要使大多数发表的成果都是错误的，科学实验就必须像罕见疾病一样：极不可能产生真阳性结果。但科学与罕见疾病不同，因为科学家可以选择他们想要验证的假设。我们已经看到，科学家很好地适应了所在专业领域的酬偿结构：获得酬劳的主要途径是发表有意义的研究成果，而阴性结果很难发表。因此，我们可以预料科学家测试的假设虽然尚未确定，但有合理的可能性是成立的。这让我们想到幽门螺杆菌的例子，大多数的阳性结果都是真阳性。约阿尼迪斯是过于悲观了，因为他对研究人员决定检验的各种假设做出了不符合实情的假设。

1 ...4 5 6 7 8 查看全文

被操纵的P值：科学论文中的数学胡扯丨展卷(6)

被数学选中的人

被操纵的城市

没有数学的修学旅行

潘多拉：被操纵的乐园

《星际穿越》中的科学

弹丸论破希望的学园和绝望高中生

教数学的体育老师

某科学的一方通行