李彦宏:人工智能刚刚走到石器时代,但未来它会像电流一样普遍(4)
2023-12-21 来源:飞速影视
假设从A点出发的100万只蚂蚁有30万只到达终点,从B点出发的有50万只到达终点,从C点出发的有40万只到达终点,系统就认为黑子走B点胜率更高,就会选择B点。这就是概率学的取样算法,相比逐项穷举法,极大地缩减了计算量。
为什么派100万只蚂蚁而不是10万只或者1000万只?这是根据计算机的计算能力和对竞争对手的大致估计来确定的。如果派10万只蚂蚁就可以得到较高胜率,那么派10万只也可以。在相同时间内派出越多蚂蚁,对计算能力要求越高。
除了下棋,人工智能还进击了金融、翻译、资讯分发领域。
金融信息可能是最复杂、最枯燥的信息,一份股转书有两百多页,还有大量的年报、半年报、研究报告、公告、反馈意见、尽职调查结果……我们不知道,有多少行业分析师是完全看完这些信息,再做出决策的。也许,不是他们不够勤勉,而是读完这些信息已经非人力所及。
20世纪90年代,一个基金经理要把市场当天产生的研报、舆情、新闻、交易数据等看完,大概需要10个小时,也就是两天的工作量。2010年,移动数据爆发之后,这个基金经理要把每天市场上产生的信息吸收掉,大概需要10个月的时间。2016年,还是这个基金经理,假如把当天市场上所有的信息看完,大概需要20年的时间,相当于整个职业生涯。所以基金经理迫切需要利用先进的智能技术,比如百度的自然语言处理技术。
机器可以瞬间完成上市公司的公告、财务报表、官方发布、社交平台、证券行情、实时新闻、行业分析报告等海量异构数据的阅读,对于文本中的图片和表格需要OCR(光学字符识别)等技术解析。紧接着,进行关键实体信息的提取,发现埋藏在实体信息之间,如行业上下游关系、供应链关系、股权变更历史、定增与重大资产重组的关系、多张财务报表之间的数据交叉验证等数据关系,形成并呈现这些复杂关系的「知识图谱」。
再说翻译。在机器翻译的模式中,人类要做的不是亲自寻找浩繁的语言规则,而是设定数学方法,调试参数,帮助计算机网络自己寻找规则。人类只要输入一种语言,就会输出另一种语言,不用考虑中间经过了怎样的处理,这就叫作端到端的翻译。这种方法听起来挺神奇,其实概率论里的贝叶斯方法、隐马尔科夫模型等都可以用来解决这个问题。
技术是神奇的。以资讯分发当中的贝叶斯方法为例,可以构建一个用概率来描述的人格特征模型。比如男性读者模型的特征之一是在阅读新闻时点击军事新闻的概率是40%,而女性读者模型是4%。一旦一个读者点击了军事新闻,根据贝叶斯公式就可以逆推这个读者的性别概率,加上这个读者的其他行为数据,综合计算,就能比较准确地判断读者的性别以及其他特征。这就是数学的「神奇」。当然,计算机神经网络使用的数学方法远不止这些。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号