当前位置：首页 > 资讯 >

自学围棋的AlphaGoZero，你也能用PyTorch造一个｜附代码实现

2023-05-04 来源:飞速影视

http://hiphotos.baidu.com/feed/pic/item/72f082025aafa40f78494918a764034f79f01963.jpg{}原作 Dylan Djian栗子棋编译整理量子位出品 | 公众号 QbitAI

遥想当年，AlphaGo的Master版本，在完胜柯洁九段之后不久，就被后辈AlphaGo Zero(简称狗零) 击溃了。
从一只完全不懂围棋的AI，到打败Master，狗零只用了21天。
而且，它不需要用人类知识来喂养，成为顶尖棋手全靠自学。
如果能培育这样一只AI，即便自己不会下棋，也可以很骄傲吧。
于是，来自巴黎的少年Dylan Djian (简称小笛) ，就照着狗零的论文去实现了一下。

他给自己的AI棋手起名SuperGo，也提供了代码(传送门见文底) 。
除此之外，还有教程——
一个身子两个头
智能体分成三个部分：
一是特征提取器(Feature Extractor) ，二是策略网络 (Policy Network) ，三是价值网络 (Value Network) 。
于是，狗零也被亲切地称为“双头怪”。特征提取器是身子，其他两个网络是脑子。
特征提取器
特征提取模型，是个残差网络 (ResNet) ，就是给普通CNN加上了跳层连接 (Skip Connection) ，让梯度的传播更加通畅。

1 2 3 4 5 ...9 查看全文

自学围棋的AlphaGoZero，你也能用PyTorch造一个｜附代码实现

中学时代：我们的省实

根据真实事件改编，用生命诠释的爱情，疾病会传染，但爱也会

围棋少年

新围棋少年

告白实行委员会：喜欢上你的那个瞬间

附身实验

一个女教练的自述

在异世界获得超强能力的我，在现实世界照样无敌～等级提升改变人生命运～