机器学习正遭遇“可重复性危机”,或已成“炼金术”?
2023-04-24 来源:飞速影视
雷锋网 AI 科技评论按:机器学习以其特有的优势逐渐在科学研究中得到大量应用,然而,其内在的“黑箱”特点也带来了一系列问题,有研究者认为正是机器学习的这种不可解释性导致了当下科学研究的“可重复性危机”——如果科学不可重复,那我们是否还能称之为真正的科学吗?与此同时,更有研究者声称机器学习已经成为一种“炼金术”。本文基于机器学习所带来的“可重复性危机”,从“是什么”“为什么”以及“下一步该如何做”三个层次进行了阐述,为这一危机寻找出路:可重复性和可解释性的机器学习模型。
一、什么是“可重复性危机”?
“如今科学界的研究人员普遍意识到存在一种“可重复性危机”(Reproducibility Crisis)。我敢说,这其中很大一部分都来源于机器学习技术在科学中的应用。”—— 摘自莱斯大学统计与电气工程系教授 Genevera Allen
机器学习方法正在取代传统的统计方法,越来越普遍地被应用到科学研究过程中,这会给科学界及其对知识的追求带来什么影响呢? 一些人认为,正是机器学习技术的“黑箱”导致了科学研究的“可重复性危机”。毕竟,如果科学不可重复,那我们是否还能称之为真正的科学吗?
(声明:本文是我自己基于参考文献中所参考的材料发表的一些观点。这是学术界的一个有争议的领域,欢迎大家进行建设性辩论。)
科学过程的生命周期
机器学习(ML)在科学研究中似乎已经无处不在,甚至在很多领域中已经替代了传统的统计方法。虽然通常来说,ML技术更易于用作分析的一项工具,但它内在的“黑箱”特点给科学家在追求真理的过程中造成了一些严重的问题。
科学界的“可重复性危机”是指是指惊人数量的研究结果无法在另一组科学家团队进行的同一个实验中实现重复。这可能就意味最初的结果是错误的。一项研究表明,在全世界所有进行过的生物医学研究中,有多达 85% 的研究结果都是徒劳无获的。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号