如果你爬过山,怎会不了解机器学习?(6)
2023-05-03 来源:飞速影视
我们已经看到了策略失效的两种方式,从某种意义上说它们是两个极端。
1. 在你遇到过的许多情况下,这种策略都是错的。
2. 这种策略只适用于你遇到过的情况,但对于新情况它一无是处。
前一个问题叫作“欠拟合”(Underfitting),是指你在制定策略时没有充分利用你的经验。后一个问题叫作“过拟合”(Overfitting),是指你太过依赖自己的经验。我们如何在这两个无用的极端策略之间找到一个折中的策略呢?答案是:让这个问题变得更像登山。登山者搜索的是一个非常有限的选择空间,我们也可以这样,前提条件是我们要对自己的选择加以限制。
我们本能地知道这一点。在思考如何评估自己的人生策略时,我们通常使用的比喻是在地球表面选择方向,而不是在无限维空间中随机游走。美国诗人罗伯特·弗罗斯特将其比作“两条分岔路”。传声头乐队(Talking Heads)的歌曲《一生一次》(Once in a Lifetime)犹如弗罗斯特的诗《未选择的路》(The Road Not Taken)的续作,你仔细品读就会发现,这首歌描绘的正是梯度下降法:
你可能会问自己
那条公路通向哪里?
你可能会问自己
我是对还是错?
你可能会对自己说
天啊!我到底做了什么?
你不必把自己的选择局限于一个旋钮。
而线性回归是选择旋钮的最常用方法之一。当统计学家寻找可根据一个已知变量的值预测另一个变量的策略时,线性回归也是他们的首选工具。例如,一个吝啬的棒球队老板可能想知道,球队的胜率对比赛门票的销量会产生多大的影响。他不想在球场上投入太多的人力物力,除非它们能有效地转化成上座率。
图3 美国职业棒球大联盟2019赛季的主场上座人数 vs 球队胜率
图3上的每个点分别代表一支球队,纵坐标表示这些球队在 2019 赛季的胜率,横坐标表示这些球队的主场上座人数。你的目标是找到一个能根据球队胜率预测主场上座人数的策略,你允许自己考虑的选择空间很小,而且其中的策略都是线性的。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号