贝叶斯自举法BayesianBootstrap(9)

2023-04-29 来源:飞速影视
df = pd.DataFrame({"x": x, "y": y})
df.head()

贝叶斯自举法BayesianBootstrap


让我们比较X上Y回归系数的两个估计量。
estimate_beta = lambda df, **kwargs: smf.wls("y ~ x", data=df, **kwargs).fit().params[1]
compare_boot(df, classic_boot, bayes_boot, estimate_beta, "beta")

贝叶斯自举法BayesianBootstrap


一般的自举过程估计的差异比贝叶斯自举大50%。 为什么? 如果我们更仔细地查看就会发现在将近20个重新采样的样本中,会得到一个非常不寻常的估计!
这个问题的原因是在某些样本中,我们可能没有任何观察结果x = 1。 因此在这些重采样的样本中,估计的系数为零。 贝叶斯自举程序不会发生这种情况,因为它不会放弃任何观察(所有观察结果总是会包含所有的结果)。
并且这里的一个重要的问题是我们没有收到任何错误消息或警告,这样我们很容易会忽视这个问题!

总结


在本文中我们介绍了贝叶斯自举法, 它的关键的想法是,每当我们的估计量以加权估计量表示时,自举过程就等于用多项式权重随机加权。 贝叶斯自举等同于用狄利克雷权重加权,这是多项式分布的连续等效物。 具有连续的权重避免了极端的样本,并且可以生成估计量的平滑分布。
本文参考
[1] B. Efron Bootstrap Methods: Another Look at the Jackknife (1979), The Annals of Statistics.
相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号