机器学习正遭遇“可重复性危机”,或已成“炼金术”?(4)

2023-04-24 来源:飞速影视
如果我们使用弹性网络回归( Elastic Net Regression,套索回归和岭回归的组合),我们将再次得到非常不同的答案。
如果我们不使用任何回归,那么由于我们有比数据点更多的变量,算法显然会使得数据过拟合,因此算法将繁琐地对所有数据点进行拟合。
显然,在线性回归中,可以通过置信区间、p-检验等统计测试来评估它的准确性。然而,对于神经网络来说,这些评估方式只能是一种奢侈的幻想,是不存在的。那么我们怎样才能确定我们通过神经网络得来结论的准确性如何呢?我们目前所能做的就是详细的陈述模型的架构和超参数,并将代码开源,以供其他科学家进行分析或对这个模型重新使用。
3、对结果的误解
对结果的误解在科学界很常见。其中一个原因是相关性并不意味着因果关系,一般来说,两个变量A和B可能存在关联的原因有以下几点:
1)A可能是由B的出现引起的
2)B可能是由A的出现引起的
3)A和B可能是由另一个混杂变量C引起的
4)A和B可能是伪相关性
两值间的相关性很容易显现出来,但产生这种结果的原因很难确定。通过在谷歌上输入伪相关性,你可以找出一些看起来非常有趣但明显十分荒谬的具有统计意义相关性例子,比如:

机器学习正遭遇“可重复性危机”,或已成“炼金术”?


机器学习正遭遇“可重复性危机”,或已成“炼金术”?


机器学习正遭遇“可重复性危机”,或已成“炼金术”?


相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号