因果推理“三问”:是什么?为什么需要?如何使用?(5)
2023-04-29 来源:飞速影视
匹配
尽管不可能进行随机实验,但我们可以找到完美匹配的干预组,在不进行干预的情况下量化结果变量。我们可以根据interests特征构建一个人工对照组。例如,我们可以在一个城市给予促销活动,并与其他没有促销活动的城市进行结果变量的比较。这些城市除了促销活动外,其他因素都是相似的。这就像一个横向比较。
我们可以使用的另一种方法是时间序列比较,这叫做switch-back检验。例如,我们可以选择一个城市,在一周内给出促销活动,然后将结果变量与最近一段时间没有促销活动的这个城市进行比较。差异将是促销的效果。
这些技术在面对网络效应时相当有用。使用横向比较或时间序列比较,我们不需要把一个市场分成不同的群体。因此,我们不需要担心同一市场中群体之间的溢出效应。在对整个市场进行比较时,必须确保对照组和干预组市场之间的唯一差异是干预。
内生性
当独立变量X(干预)与回归中的误差项相关,从而使估计结果(干预对结果变量Y的影响)产生偏差时,就会产生内生性。引起内生性的方式有三种:
遗漏变量: 当我们没有将混淆变量作为控制变量纳入回归,或无法量化混淆变量时。例如,如果我们想估计教育(干预)对未来收入(结果变量)的影响,就需要在回归中加入一个称为 "能力 "的混淆变量。作为一个混淆变量,"能力 "会增加接受高等教育的机会,增加获得高收入的机会。但是,由于我们无法轻易地量化 "能力",所以很难将其纳入回归中。简单地用 "学历 "对 "收入 "进行回归,会使处理效果出现偏差。如果我们能够量化混淆变量,我们就可以将它们全部纳入回归中。如果不能,我们需要使用回归不连续或工具变量来进行随意推断。我将在后面讨论它们。如果我们可以量化混杂变量,则可以将它们全部包含在回归中。如果不是,我们需要使用回归不连续性或工具变量来进行因果推断。
稍后再讨论。 反向因果关系:当X可以影响Y,Y也可以影响X时,就存在反向因果关系。例如,如果我们在超市给在这家超市购物的顾客发放优惠券。优惠券会增加收到优惠券的顾客的销售额,这些顾客会更多的出现在超市,也更有可能收到更多的优惠券。循环下去。在应对这个问题的时候,我们需要在中间引入一些随机化。比如,我们并不是给所有出现在超市的顾客发放优惠券,而是随机选择一些顾客发放优惠券,并估算出差异。引入一定程度的随机化会减少估计的偏差。选择偏差:如上所述,如果具有某些特征的单位更容易被选入干预组,那么我们就面临选择偏差。我们观察到的结果变量的差异不仅是由干预引起的,也是由于组间其他预先存在的差异。如果我们相信治疗组和对照组有平行的趋势,即它们之间的差异不会因为治疗或时间而改变,我们可以使用DID来估计治疗效果。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号