Nature计算科学综述:经由准实验,从观察数据中推测因果关系(11)
2023-05-20 来源:飞速影视
此外,研究人员可以将这些准实验中的因果估计与其他数据结合起来,以提高机器学习的性能。例如,在基于观察研究中,已经有使用重叠实验数据来控制混杂因子的工作,这可以扩展到利用准实验数据[64]。在与环境互动的过程中,强化学习执行干预、做出决策和形成政策,这些都是固有的因果任务[11, 65]。
然而,现代的强化学习往往需要很昂贵的训练成本,因此纳入准实验的因果效应估计可能是一个有希望的提高效率的方式[66]。特别是,为了优化策略,已将断点分析应用于多臂老虎机问题[67]。随着对因果关系的重新关注[69, 70],人们对可解释的人工智能[68]产生了极大的兴趣:当人们改变输入特征时,机器学习模型的预测是如何改变的?
虽然一些可解释的人工智能方法依赖于对数据进行扰动以产生解释[71, 72],但是利用数据中自然发生的随机性来估计因果效应以保留原始数据的特征分布是有价值的,因为当给出一个分布不均匀的输入数据时,机器学习模型可以表现得不符合常规[73]。结合准实验和对他们的无偏因果估计,加上更灵活和更强大的机器学习方法,保证了这些方法能取长补短。
传统的经济学工作更多地关注参数估计(例如,估计和解释回归系数)而非预测,这为机器学习融入准实验方法带来了机会[74]。在某些情况下,研究人员可以用更灵活的机器学习方法来代替传统方法中使用的参数估计。例如工具变量分析中的第一阶段回归实际上是一个预测任务。利用 LASSO 回归、核方法和深度学习算法[75, 76, 77],将工具变量扩展到高维数据、非线性数据域。从时间序列数据推断因果关系也越来越受到关注,在时间序列数据中,集合模型和矩阵填充(matirix completion)方法被用于因果估计[78, 79]。使用机器学习技术,结合时间序列中因果推断,这一应用方向前途光明。
另一个机器学习可以改进准实验的领域是精准定位目标人群来进行因果估计。通过准实验所作的估计只对特定群体有效——例如工具变量分析和断点回归中受某种工具或阈值影响的个人。预测哪些个体可能对某种干预或工具变量产生反应[80, 81, 82],可以增加因果估计的可解释性,并为研究设计提供排除标准。此外,机器学习方法擅长优化损失函数,这可以用于精准干预策略的制定。例如,为了最大限度地发挥干预效果或最大限度地减少潜在危害[83, 84],研究人员已经开展了优化断点分析处理阈值的工作。机器学习扩展后的准实验方法可描述因果适用的目标人群,为更好的政策选择提供了信息。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号