贝叶斯自举法BayesianBootstrap(3)
2023-04-29 来源:飞速影视
# 10000.000000000005
权重的总和(大约)为1,所以我们必须将它们乘以N。我们可以画出权重的分布,现在为了得到了连续的权重,我们必须近似分布。
sns.histplot(bayesian_weights, color="C1", kde=True).set(title="Dirichlet Weights");
狄利克雷分布有一个参数α,我们对所有观测值都设置为1。它是做什么的?
α参数本质上决定被抽样的绝对概率和相对概率。增加所有观测值的α值可以减少分布的偏斜,使所有观测值具有更相似的权重。对于α→∞,所有的观测值得到相同的权重。
那么我们应该如何选择α的值?Shao和Tu(1995)提出以下建议。
The distribution of the random weight vector does not have to be restricted to the Diri(l, … , 1). Later investigations found that the weights having a scaled Diri(4, … ,4) distribution give better approximations (Tu and Zheng, 1987)
根据上面的建议,让我们来看看α=4的狄利克雷分布和之前α=1的狄利克雷分布是如何比较的。
bayesian_weights2 = np.random.dirichlet(np.ones(N) * 4, 1)[0] * N
sns.histplot(bayesian_weights, color="C1")
sns.histplot(bayesian_weights2, color="C2").set(title="Comparing Dirichlet Weights");
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号