当前位置：首页 > 资讯 >

如果你爬过山，怎会不了解机器学习？(6)

2023-05-03 来源:飞速影视

我们已经看到了策略失效的两种方式，从某种意义上说它们是两个极端。
1. 在你遇到过的许多情况下，这种策略都是错的。
2. 这种策略只适用于你遇到过的情况，但对于新情况它一无是处。
前一个问题叫作“欠拟合”（Underfitting），是指你在制定策略时没有充分利用你的经验。后一个问题叫作“过拟合”（Overfitting），是指你太过依赖自己的经验。我们如何在这两个无用的极端策略之间找到一个折中的策略呢？答案是：让这个问题变得更像登山。登山者搜索的是一个非常有限的选择空间，我们也可以这样，前提条件是我们要对自己的选择加以限制。
我们本能地知道这一点。在思考如何评估自己的人生策略时，我们通常使用的比喻是在地球表面选择方向，而不是在无限维空间中随机游走。美国诗人罗伯特·弗罗斯特将其比作“两条分岔路”。传声头乐队（Talking Heads）的歌曲《一生一次》（Once in a Lifetime）犹如弗罗斯特的诗《未选择的路》（The Road Not Taken）的续作，你仔细品读就会发现，这首歌描绘的正是梯度下降法：
你可能会问自己
那条公路通向哪里？
你可能会问自己
我是对还是错？
你可能会对自己说
天啊！我到底做了什么？
你不必把自己的选择局限于一个旋钮。
而线性回归是选择旋钮的最常用方法之一。当统计学家寻找可根据一个已知变量的值预测另一个变量的策略时，线性回归也是他们的首选工具。例如，一个吝啬的棒球队老板可能想知道，球队的胜率对比赛门票的销量会产生多大的影响。他不想在球场上投入太多的人力物力，除非它们能有效地转化成上座率。

图3 美国职业棒球大联盟2019赛季的主场上座人数 vs 球队胜率
图3上的每个点分别代表一支球队，纵坐标表示这些球队在 2019 赛季的胜率，横坐标表示这些球队的主场上座人数。你的目标是找到一个能根据球队胜率预测主场上座人数的策略，你允许自己考虑的选择空间很小，而且其中的策略都是线性的。

1 ...4 5 6 7 8 ...12 查看全文

如果你爬过山，怎会不了解机器学习？(6)

如果从没爱过你

如果有一天我将会离开你

安娜·妮可·史密斯：你们不了解我

对不起，我们错过了你

抖音DJ《多年以后》《狂浪》《爱过了也伤过了》《你是我的人》

如果这些墙会歌唱

女孩说摘下口罩就会死，老师偏不信邪，结果悲剧发生了，恐怖片

如果我爱你