当前位置：首页 > 资讯 >

走进高维空间之“维度魔咒”，所有的“邻居”都去哪了？(5)

2023-04-26 来源:飞速影视

在这个例子中，假设使用最接近索引点的10%的训练数据点，从索引点出发，需要在预测器空间中达到多远才能捕获10%的训练数据？更具体地说，需要在邻域中包括多大比例的预测值范围？
单预测器的情况实际上很简单。因为训练数据点是沿着单一维度均匀分布的，而预测器的范围是[-0.5,0.5]，为了捕获10%的训练数据点，只需要包含预测器范围的10%。如下图所示：

看上去很合理，对吗？我们不需要离索引点太远，就可以把10%的训练数据纳入，只需要在两个方向上取0.05个单位。目前看起来没什么特别，也许还有点无聊。让我们看看当入一个更高的维度时会发生什么。
邻居的秘密
假设我们有两个预测器，每个预测器的范围是-0.5到0.5，训练数据点沿两个维度均匀分布。

这是我们的索引点：

1 ...3 4 5 6 7 8 查看全文

走进高维空间之“维度魔咒”，所有的“邻居”都去哪了？(5)

维度之间

时间去哪儿了

思维空间

我所有的朋友都死了

一个叫欧维的男人决定去死

如果，有一所只有帅哥的高中

老公去哪了

去拉斯维加斯的七天