走进高维空间之“维度魔咒”,所有的“邻居”都去哪了?(5)
2023-04-26 来源:飞速影视
在这个例子中,假设使用最接近索引点的10%的训练数据点,从索引点出发,需要在预测器空间中达到多远才能捕获10%的训练数据?更具体地说,需要在邻域中包括多大比例的预测值范围?
单预测器的情况实际上很简单。因为训练数据点是沿着单一维度均匀分布的,而预测器的范围是[-0.5,0.5],为了捕获10%的训练数据点,只需要包含预测器范围的10%。如下图所示:
看上去很合理,对吗?我们不需要离索引点太远,就可以把10%的训练数据纳入,只需要在两个方向上取0.05个单位。目前看起来没什么特别,也许还有点无聊。让我们看看当入一个更高的维度时会发生什么。
邻居的秘密
假设我们有两个预测器,每个预测器的范围是-0.5到0.5,训练数据点沿两个维度均匀分布。
这是我们的索引点:
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号