Nature计算科学综述:经由准实验,从观察数据中推测因果关系(10)
2023-05-20 来源:飞速影视
然而,双重差分的透明性和灵活性使其成为一种有吸引力的因果推断技术,前提是进行了适当的控制,并且双重差分发的假设是合理的。由于许多数据科学问题涉及到时间序列,该方法有可能被广泛用于从观测数据中获得因果估计。
6. 准实验的局限性
使用准实验技术所作的因果估计的概括性有其局限性。研究人员回顾的所有方法都是对特定人群的因果效应进行估计。个人自愿评估估计受工具变量的影响的个人的因果效应[52]。断点回归 估计了个人在阈值时的因果效应[53]。在更强有力的假设下,从阈值以外推断因果效应是可行的[54]。双重差分法对选定的治疗组的因果效应进行了估计。然而,研究人员注意到,对可泛化性的关注甚至延伸到了随机化实验,即参与者的人口统计学可以将因果发现限制在一个特定的人群中[55]。当应用准实验方法时,就像所有的因果分析一样,研究人员必须留意这些估计对哪些人群是有效的。
一个实际的考虑是,准实验需要一个特定的数据生成过程或观察到应用的特定类型的变量,例如与干预密切相关的工具变量、断点回归中阈值的存在与否;或是否存在一个适当的控制组随着时间的推移,可与治疗组进行比较。因此,使用准实验方法估计因果效应取决于数据是否符合这些框架,因为人们通常不能将现有数据改造成这些方法中的一种:“实验设计胜过分析”[56]。
此外,在没有适当考虑技术的基础假设的情况下,寻找适合这些设计的数据存在一些风险,如果不满足这些假设,分析可能会失效。正如上一节所讨论的那样,如果仔细考虑假设,从表面上看,似乎适合应用这些方法的数据也可能不会奏效。
7. 数据科学可以受益于准实验,
准实验可以从机器学习中获益
准实验应该更广泛地应用于数据科学 ,因为它们是在许多情况下有意义地估计因果关系的唯一方式。例如,工具变量分析被用来评估推荐系统的因果效应[57],即利用产品受欢迎程度中的随机冲击作为工具变量[58]。在流行病学中,一种流行的技术叫做孟德尔随机化,它使用遗传变异作为工具变量[59, 60]。断点分析在医疗实践中比比皆是,同时也应该扩展至更多应用[61]。双重差分法可以用来评估政策和执行在诸如广告[62]和公共健康[63]等各个领域的长期效果。准实验策略可以估计在这些情况下的因果效应,为决策提供有用的反馈。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号