Facebook ELF OpenGo升级!田渊栋开源超级围棋AI(附论文下载)

2019 年 2 月 14 日 中国人工智能学会

转自 专知 

【导读】去年,facebook基于ELF平台开发出了AlphaGoZero的开源版本OpenGo,以期复现AlphaGoZero,并希望通过开源行为激励研究者思考这一技术的应用点及研究方向。时隔半年,Facebook再次发布新版OpenGo,大幅度提升算法模型性能。



介绍:


去年我们发布了ELF OpenGo,已经得到了AI研究者们的广泛使用,来构建游戏机器人,以便更好的理解AI系统如何学习,以及方便围棋爱好者们测试自己的技艺。这款开源机器人与人类对局过程中,表现得非常出色,包括与顶级职业围棋选手的20比0的战绩。因此也被广泛应用于人工智能研究团体中,进行围棋实验,复现他人研究成果中。ELF OpenGo已经在AI围棋比赛中与多个修改版本进行了较量。同时也会与人类组队,曾经在一次比赛中,展示了混合配对能力,每个人与一个OpenGo机器人组队,共同对抗另一个AI-human团队。


Facebook AI研究团队(FAIR)宣布了ELF OpenGo的新功能特点以及最新的研究成果,包括了一个重新训练的模型,同时还包括了一个windows系统的可执行机器人,使得围棋玩家更容易使用该系统作为训练辅助工具。另外,还包括了一份特殊的档案,其中包括了OpenGo87000个职业围棋游戏的分析。现在玩家可以看到我们的系统是如何对18世纪最优秀的选手进行排名的。我们很高兴这个多功能平台能够帮助研究人员更好的理解AI,页很高兴看到Go社区的玩家使用它来训练自己的技艺。


韩国Baduk协会公关副总监Beomgeun Cho说:“我可以肯定的说,ELF OpenGo项目给韩国围棋界带来了巨大的影响。自ELF Go面试以来,几乎所有的韩国职业棋手都在使用该软件分析自己和其他选手的器具,正因为如此,韩国的围棋水平不仅提高了,而且全世界的围棋水平同样跟着得到了提升。”


当DeepMind在2017年发布AlphaGo Zero机器人的结果时,展示了这款有着4000年历史的围棋游戏作为深度强化学习实验台的潜力。但尽管AlphaGoZero及其后继者AlphaZero已经证明,人工智能虽然可以击败人类围棋棋手,但它们的功能更多的是作为深度强化学习的一个理想例子,而非更广泛的人工智能研究领域的工具。


我们去年发布了AlphaZero的重新实现版本,同时我们呢认识到,由于需要大量的计算资源,即使发布了开源大卖,大多数研究人员也无法重现我们的结果,这也是我们在一篇文章中分享的那样,这项研究揭示了为什么人工智能对人类玩家如此强大,也阐明了这项技术的局限性,这可能有助于研究人员更好的理解其潜在机制,并将其应用于其他情况。


对于研究社区,我们更新的模型是目前ELF OpenGo最好的版本,通过2000万局自我对弈来生成实现。对于那些项深入研究基于RL的围棋机器人如何学习的研究人员来说,论文中详细介绍了大量的消融实验结果,在评估过程中修改个体特征,以更好的理解这类算法的特性。


更详细内容,请参见原始链接及论文原文~~


【论文便捷下载】

 请关注专知公众号(点击上方蓝色专知关注

  • 后台回复“EOG” 就可以获取《ELF OpenGo最新研究论文》的下载链接~ 

原文链接:

https://ai.facebook.com/blog/open-sourcing-new-elf-opengo-bot-and-go-research/

项目链接:

https://facebook.ai/developers/tools/elf-opengo


Github链接:

https://github.com/pytorch/ELF


附论文全文:


-END-


专 · 知

专知《深度学习:算法到实战》课程全部完成!480+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!


请加专知小助手微信(扫一扫如下二维码添加),咨询《深度学习:算法到实战》参团限时优惠报名~

欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!

点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程



登录查看更多
2

相关内容

Facebook 是一个社交网络服务网站,于 2004 年 2 月 4 日上线。从 2006 年 9 月到 2007 年 9 月间,该网站在全美网站中的排名由第 60 名上升至第 7 名。同时 Facebook 是美国排名第一的照片分享站点。 2012年 2 月 1 日,Facebook向美国证券交易委员会提交集资规模为 50 亿美元的上市申请。
专知会员服务
54+阅读 · 2020年7月4日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
38+阅读 · 2020年3月9日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
2019必读的十大深度强化学习论文
专知会员服务
58+阅读 · 2020年1月16日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
206+阅读 · 2020年1月13日
MATLAB玩转深度学习?新书「MATLAB Deep Learning」162页pdf
专知会员服务
99+阅读 · 2020年1月13日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
专知会员服务
208+阅读 · 2019年8月30日
近期强化学习领域论文导读(附源码)
人工智能前沿讲习班
7+阅读 · 2019年6月15日
自动驾驶仿真软件列表
智能交通技术
13+阅读 · 2019年5月9日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
3+阅读 · 2018年6月14日
Arxiv
8+阅读 · 2018年5月21日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关VIP内容
专知会员服务
54+阅读 · 2020年7月4日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
38+阅读 · 2020年3月9日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
2019必读的十大深度强化学习论文
专知会员服务
58+阅读 · 2020年1月16日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
206+阅读 · 2020年1月13日
MATLAB玩转深度学习?新书「MATLAB Deep Learning」162页pdf
专知会员服务
99+阅读 · 2020年1月13日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
专知会员服务
208+阅读 · 2019年8月30日
Top
微信扫码咨询专知VIP会员