报名 | 腾讯AI Lab:用深度强化学习在王者荣耀虚拟环境中构建「绝悟」AI

2019 年 12 月 27 日 机器之心

机器之心发布

机器之心编辑部

在机器之心最新的一期 AAAI 2020 线上分享中,我们邀请到了腾讯 AI Lab AI+游戏领域高级研究员叶德珩博士为大家介绍他们王者荣耀 AI 智能体研究。
游戏,一直是人工智能技术研究与落地的重要场景之一。 过去几年,DeepMind 围棋项目 AlphaGo、星际争霸 AI AlphaStar、OpenAI Dota2 项目 OpenAI Five 等游戏 AI 吸引了全球人工智能社区的关注。


而在国内,腾讯 AI Lab 也一直致力于 AI+游戏的研究。 近日,基于腾讯天美工作室开发的热门 MOBA 类手游《王者荣耀》,腾讯 AI Lab 公布了一项用深度强化学习来为智能体预测游戏动作研究成果,论文《Mastering Complex Control in MOBA Games with Deep Reinforcement Learning》已被 AAAI 2020 接收。


在机器之心最新的一期 AAAI 2020 线上分享中,我们邀请到了论文一作、腾讯 AI Lab AI+游戏领域高级研究员叶德珩博士为大家介绍他们的研究成果。



个人简介: 叶德珩(Deheng Ye)博士,现任腾讯 AI Lab AI+游戏领域高级研究员,主要工作方向是机器学习在 AI+游戏领域的技术研究与应用探索,涉及强化学习、模仿学习、领域数据挖掘、多智能体决策等。


叶德珩于 2016 年在新加坡南洋理工大学计算机科学系取得博士学位,期间的研究方向为软件相关知识挖掘和代码挖掘。 他曾担任 IJCAI,AAAI 等学术会议的程序委员会成员。


演讲概要: 多人在线战术竞技游戏(MOBA)已经成为检验前沿人工智能的动作决策和预测能力的重要平台。 基于腾讯天美工作室开发的热门 MOBA 游戏《王者荣耀》,腾讯 AI Lab 正努力探索强化学习技术在复杂环境中的应用潜力。 本文即是其中的一项成果,研究了使用深度强化学习来为智能体预测游戏动作的方法。


具体来说,在这篇论文中,我们研究 MOBA 1v1 游戏中 AI 智能体的复杂动作控制问题。 这个问题有着比传统 1v1 游戏,例如围棋、将棋、Atari 等,更为复杂的状态和动作空间,从而使得 AI 的策略学习十分困难。 我们从系统和算法的层面,提出了一个强化学习框架来研究这个问题。 我们开发了一个高可扩展低耦合的强化训练系统; 并提出了一系列的算法创新,包括一个 actor-critic 神经网络,控制依赖的解耦,目标注意力机制,动作空间剪枝,dual-clip PPO 等。 在王者荣耀真实游戏环境中的测试显示,我们训练的 AI 智能体能在不同类型的英雄上战胜顶尖职业选手。


论文地址:https://arxiv.org/abs/1912.09729


时间:北京时间 2020 年 1 月 2 日 20:00-21:00


AAAI 2020 机器之心线上分享


2020 年 2 月 7 日-2 月 12 日,AAAI 2020 将于美国纽约举办。 不久之前,大会官方公布了今年的论文收录信息: 收到 8800 篇提交论文,评审了 7737 篇,接收 1591 篇,接收率 20.6%。


为向读者们分享更多的优质内容、促进学术交流,在 AAAI 2020 开幕之前,机器之心将选出数篇优质论文,邀请论文作者来做线上分享。 整场分享包括两个部分: 论文解读和互动答疑。


线上分享将在「AAAI 2020 交流群」中进行,加群方式: 添加机器之心小助手(syncedai4),备注「AAAI」,邀请入群。 入群后将会公布直播链接。


登录查看更多
0

相关内容

腾讯AI Lab(Tencent AI Lab),即腾讯人工智能实验室,实验室的愿景是打造腾讯全面AI竞争力,让人工智能未来无处不在(Make AI Everywhere)。
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
专知会员服务
206+阅读 · 2019年8月30日
近期强化学习领域论文导读(附源码)
人工智能前沿讲习班
7+阅读 · 2019年6月15日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
HAQ: Hardware-Aware Automated Quantization
Arxiv
6+阅读 · 2018年11月21日
Arxiv
12+阅读 · 2018年1月28日
VIP会员
Top
微信扫码咨询专知VIP会员