成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
AlphaGo Zero
关注
13
AlphaGo Zero是谷歌下属公司Deepmind的新版程序。从空白状态学起,在无任何人类输入的条件下,AlphaGo Zero能够迅速自学围棋,并以100:0的战绩击败“前辈”。 2017年10月19日凌晨,在国际学术期刊《自然》(Nature)上发表的一篇研究论文中,谷歌下属公司Deepmind报告新版程序AlphaGo Zero:从空白状态学起,在无任何人类输入的条件下,它能够迅速自学围棋,并以100:0的战绩击败“前辈”。Deepmind的论文一发表,TPU的销量就可能要大增了。其100:0战绩有“造”真嫌疑。
综合
百科
VIP
热门
动态
论文
精华
Understanding Game-Playing Agents with Natural Language Annotations
Arxiv
0+阅读 · 2022年4月15日
OLIVAW: Mastering Othello without Human Knowledge, nor a Fortune
Arxiv
0+阅读 · 2022年3月4日
Leela Zero Score: a Study of a Score-based AlphaGo Zero
Arxiv
0+阅读 · 2022年1月31日
OLIVAW: Mastering Othello with neither Humans nor a Penny
Arxiv
0+阅读 · 2021年6月22日
OLIVAW: Mastering Othello with neither Humans nor a Penny
Arxiv
0+阅读 · 2021年6月21日
Elo Ratings for Large Tournaments of Software Agents in Asymmetric Games
Arxiv
0+阅读 · 2021年4月23日
Self-play Learning Strategies for Resource Assignment in Open-RAN Networks
Arxiv
0+阅读 · 2021年3月3日
Investment vs. reward in a competitive knapsack problem
Arxiv
0+阅读 · 2021年1月26日
POLY-HOOT: Monte-Carlo Planning in Continuous Space MDPs with Non-Asymptotic Analysis
Arxiv
0+阅读 · 2020年12月30日
HEX and Neurodynamic Programming
Arxiv
0+阅读 · 2020年8月11日
LINTS^RT: A Learning-driven Testbed for Intelligent Scheduling in Embedded Systems
Arxiv
0+阅读 · 2020年7月10日
Mastering the working sequence in human-robot collaborative assembly based on reinforcement learning
Arxiv
0+阅读 · 2020年7月8日
POLY-HOOT: Monte-Carlo Planning in Continuous Space MDPs with Non-Asymptotic Analysis
Arxiv
0+阅读 · 2020年6月8日
Solving NP-Hard Problems on Graphs by Reinforcement Learning without Domain Knowledge
Arxiv
0+阅读 · 2019年5月28日
ELF OpenGo: An Analysis and Open Reimplementation of AlphaZero
Arxiv
1+阅读 · 2019年5月8日
参考链接
父主题
AlphaGo
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top