AI的棋局,其实也是一部热血成长史(5)

2023-05-01 来源:飞速影视
总体来说,AlphaGo在以下四个方面取得重要突破:
01 自学习能力
AlphaGo的对弈知识是通过深度学习方法自己掌握的,而不是像“深蓝”那样编在程序里,它是通过大量棋谱和自我对弈完成的。这种深度学习能力,使得AlphaGo能不断学习进化,产生了很强的适应性,而适应性造就了复杂性,复杂自适应性又是智能演化最普遍的途径。
02 捕捉经验能力
找到了一种捕捉围棋高手的经验,即“棋感直觉”的方法。所谓棋感,就是通过训练得到的直觉,“只可意会,不可言传”。AlphaGo通过深度学习产生的策略网络(走棋网络),在对抗过程中可以实现局部步法的优化;通过增强学习方法生成的估值网络,实现对全局不间断的评估,用于判定每一步棋对全局棋胜负的影响。此外,还可以通过快速走子算法和蒙特卡罗树搜索机制,加快走棋速度,实现对弈质量和速度保证的合理折中。这些技术使得计算机初步具备了既可以考虑局部得失,又可以考虑全局整体胜负的能力。而这种全局性的“直觉”平衡能力,正是过去人们认为人类独有、计算机难以做到的。
03 发现创新能力
发现了人类没有的围棋步法,初步展示了机器发现“新事物”的“创造性”。从观战的超一流棋手讨论和反应可以看出,AlphaGo的下发有些超出了他们的预料,但事后评估又认为是好棋。这意味着AlphaGo的增强学习算法,甚至可以从大数据中发现人类千百年来还未发现的规律和知识,为人类扩展自己的知识体系开辟了新的认知通道。也难怪会有人感叹AlphaGo难道是《棋魂》中的SAI转世?
04 方法具有通用性
这与很多其他博弈程序非常不同,通用性意味着对解决其他问题极具参考价值,AlphaGo运用的方法,实际上是一种解决复杂决策问题的通用框架,而不仅是围棋领域的独门秘籍。自学习的能力,使得计算机有了进化的可能,通用性则使其不再局限于围棋领域。
//////////
从国际跳棋到堪称是世界上最复杂棋盘游戏的围棋,AI棋手不断突破着技术的上限。棋盘竞赛的喧嚣背后,是机器博弈技术的进步和发展历程。
最后,和你分享我们在2001年的《棋魂》动画版中,发现的这样一段对话:

AI的棋局,其实也是一部热血成长史


——“神之一手会从这里面(电脑)诞生”
——“据说电脑下围棋要超过人类还要花一百年呐”
来源:中国科学院自动化研究所
编辑:C&C

相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号