成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
报名 | 腾讯AI Lab:用深度强化学习在王者荣耀虚拟环境中构建「绝悟」AI
2019 年 12 月 27 日
机器之心
机器之心发布
机器之心编辑部
在机器之心最新的一期 AAAI 2020 线上分享中,我们邀请到了腾讯 AI Lab AI+游戏领域高级研究员叶德珩博士为大家介绍他们王者荣耀 AI 智能体研究。
游戏,一直是人工智能技术研究与落地的重要场景之一。
过去几年,DeepMind 围棋项目 AlphaGo、星际争霸 AI AlphaStar、OpenAI Dota2 项目 OpenAI Five 等游戏 AI 吸引了全球人工智能社区的关注。
而在国内,腾讯 AI Lab 也一直致力于 AI+游戏的研究。
近日,基于腾讯天美工作室开发的热门 MOBA 类手游《王者荣耀》,腾讯 AI Lab 公布了一项用深度强化学习来为智能体预测游戏动作研究成果,论文
《Mastering Complex Control in MOBA Games with Deep Reinforcement Learning》
已被 AAAI 2020 接收。
在机器之心最新的一期 AAAI 2020 线上分享中,我们邀请到了论文一作、腾讯 AI Lab AI+游戏领域高级研究员叶德珩博士为大家介绍他们的研究成果。
个人简介:
叶德珩(Deheng Ye)博士,现任腾讯 AI Lab AI+游戏领域高级研究员,主要工作方向是机器学习在 AI+游戏领域的技术研究与应用探索,涉及强化学习、模仿学习、领域数据挖掘、多智能体决策等。
叶德珩于 2016 年在新加坡南洋理工大学计算机科学系取得博士学位,期间的研究方向为软件相关知识挖掘和代码挖掘。
他曾担任 IJCAI,AAAI 等学术会议的程序委员会成员。
演讲概要:
多人在线战术竞技游戏(MOBA)已经成为检验前沿人工智能的动作决策和预测能力的重要平台。
基于腾讯天美工作室开发的热门 MOBA 游戏《王者荣耀》,腾讯 AI Lab 正努力探索强化学习技术在复杂环境中的应用潜力。
本文即是其中的一项成果,研究了使用深度强化学习来为智能体预测游戏动作的方法。
具体来说,在这篇论文中,我们研究 MOBA 1v1 游戏中 AI 智能体的复杂动作控制问题。
这个问题有着比传统 1v1 游戏,例如围棋、将棋、Atari 等,更为复杂的状态和动作空间,从而使得 AI 的策略学习十分困难。
我们从系统和算法的层面,提出了一个强化学习框架来研究这个问题。
我们开发了一个高可扩展低耦合的强化训练系统;
并提出了一系列的算法创新,包括一个 actor-critic 神经网络,控制依赖的解耦,目标注意力机制,动作空间剪枝,dual-clip PPO 等。
在王者荣耀真实游戏环境中的测试显示,我们训练的 AI 智能体能在不同类型的英雄上战胜顶尖职业选手。
论文地址:https://arxiv.org/abs/1912.09729
时间:
北京时间 2020 年 1 月 2 日 20:00-21:00
AAAI 2020 机器之心线上分享
2020 年 2 月 7 日-2 月 12 日,AAAI 2020 将于美国纽约举办。
不久之前,大会官方公布了今年的论文收录信息:
收到 8800 篇提交论文,评审了 7737 篇,接收 1591 篇,接收率 20.6%。
为向读者们分享更多的优质内容、促进学术交流,在 AAAI 2020 开幕之前,机器之心将选出数篇优质论文,邀请论文作者来做线上分享。
整场分享包括两个部分:
论文解读和互动答疑。
线上分享将在「AAAI 2020 交流群」中进行,加群方式:
添加机器之心小助手(syncedai4),备注「AAAI」,邀请入群。
入群后将会公布直播链接。
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
腾讯AI Lab
关注
28
腾讯AI Lab(Tencent AI Lab),即腾讯人工智能实验室,实验室的愿景是打造腾讯全面AI竞争力,让人工智能未来无处不在(Make AI Everywhere)。
【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解
专知会员服务
79+阅读 · 2020年7月2日
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
「强化学习之路」清华博士后解读83篇文献,万字长文总结
专知会员服务
65+阅读 · 2020年2月28日
[WWW2020-腾讯QQ看点团队]未来上下文建模会话推荐,Modeling Future Contexts
专知会员服务
35+阅读 · 2020年2月21日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
【综述】多智能体深度强化学习综述,附49页PDF
专知会员服务
206+阅读 · 2019年8月30日
【IJCAI 2019】人工智能在交通中的应用(Artificial Intelligence in Transportation),滴滴AI实验室研究员王征博士,秦志伟博士
专知会员服务
60+阅读 · 2019年8月10日
【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation,滴滴 AI Labs
专知会员服务
64+阅读 · 2019年8月8日
B站学强化学习?港中文周博磊变身up主,中文课程已上线
机器之心
18+阅读 · 2020年3月18日
DeepMind 一次性开源 3 个新框架!深度强化学习应用落地即将迎来春天?
AI科技评论
9+阅读 · 2019年9月19日
DeepMind开源强化学习游戏框架,25款线上游戏等你来挑战
机器之心
9+阅读 · 2019年8月28日
近期强化学习领域论文导读(附源码)
人工智能前沿讲习班
7+阅读 · 2019年6月15日
【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习
产业智能官
16+阅读 · 2018年12月27日
【前沿跟进】Google, OpenAI提出层次强化学习新思路
CreateAMind
13+阅读 · 2018年5月31日
人工智能的热点:深度强化学习正成为通往通用AI的关键
DeepTech深科技
4+阅读 · 2018年4月11日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
《重磅消息》深度强化学习入门及进阶课程第二期开课啦
深度学习与NLP
17+阅读 · 2017年9月4日
深度 | 基于TensorFlow打造强化学习API:TensorForce是怎样炼成的?
机器之心
4+阅读 · 2017年7月16日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning
Arxiv
5+阅读 · 2019年3月25日
HAQ: Hardware-Aware Automated Quantization
Arxiv
6+阅读 · 2018年11月21日
Reward learning from human preferences and demonstrations in Atari
Arxiv
8+阅读 · 2018年11月15日
Generating Fine-Grained Open Vocabulary Entity Type Descriptions
Arxiv
4+阅读 · 2018年5月27日
Learning to Adapt: Meta-Learning for Model-Based Control
Arxiv
9+阅读 · 2018年3月30日
HONE: Higher-Order Network Embeddings
Arxiv
12+阅读 · 2018年1月28日
Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments
Arxiv
6+阅读 · 2018年1月16日
DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning
Arxiv
19+阅读 · 2018年1月8日
Natural Language Processing: State of The Art, Current Trends and Challenges
Arxiv
4+阅读 · 2017年8月17日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
腾讯AI Lab
王者荣耀
深度强化学习
强化学习
AAAI
智能体
相关VIP内容
【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解
专知会员服务
79+阅读 · 2020年7月2日
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
「强化学习之路」清华博士后解读83篇文献,万字长文总结
专知会员服务
65+阅读 · 2020年2月28日
[WWW2020-腾讯QQ看点团队]未来上下文建模会话推荐,Modeling Future Contexts
专知会员服务
35+阅读 · 2020年2月21日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
【综述】多智能体深度强化学习综述,附49页PDF
专知会员服务
206+阅读 · 2019年8月30日
【IJCAI 2019】人工智能在交通中的应用(Artificial Intelligence in Transportation),滴滴AI实验室研究员王征博士,秦志伟博士
专知会员服务
60+阅读 · 2019年8月10日
【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation,滴滴 AI Labs
专知会员服务
64+阅读 · 2019年8月8日
热门VIP内容
开通专知VIP会员 享更多权益服务
军用数据链:武器装备神经,联合作战基石,31页pdf
【ETHZ博士论文】超越像素深度:通过深度学习增强超分辨率技术,198页pdf
2018∼2023年国家自然科学基金人工智能学科人才项目申请及资助综述
【NeurIPS2024】《AmoebaLLM:构建任意形状的大型语言模型以实现高效和即时部署》
相关资讯
B站学强化学习?港中文周博磊变身up主,中文课程已上线
机器之心
18+阅读 · 2020年3月18日
DeepMind 一次性开源 3 个新框架!深度强化学习应用落地即将迎来春天?
AI科技评论
9+阅读 · 2019年9月19日
DeepMind开源强化学习游戏框架,25款线上游戏等你来挑战
机器之心
9+阅读 · 2019年8月28日
近期强化学习领域论文导读(附源码)
人工智能前沿讲习班
7+阅读 · 2019年6月15日
【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习
产业智能官
16+阅读 · 2018年12月27日
【前沿跟进】Google, OpenAI提出层次强化学习新思路
CreateAMind
13+阅读 · 2018年5月31日
人工智能的热点:深度强化学习正成为通往通用AI的关键
DeepTech深科技
4+阅读 · 2018年4月11日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
《重磅消息》深度强化学习入门及进阶课程第二期开课啦
深度学习与NLP
17+阅读 · 2017年9月4日
深度 | 基于TensorFlow打造强化学习API:TensorForce是怎样炼成的?
机器之心
4+阅读 · 2017年7月16日
相关论文
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning
Arxiv
5+阅读 · 2019年3月25日
HAQ: Hardware-Aware Automated Quantization
Arxiv
6+阅读 · 2018年11月21日
Reward learning from human preferences and demonstrations in Atari
Arxiv
8+阅读 · 2018年11月15日
Generating Fine-Grained Open Vocabulary Entity Type Descriptions
Arxiv
4+阅读 · 2018年5月27日
Learning to Adapt: Meta-Learning for Model-Based Control
Arxiv
9+阅读 · 2018年3月30日
HONE: Higher-Order Network Embeddings
Arxiv
12+阅读 · 2018年1月28日
Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments
Arxiv
6+阅读 · 2018年1月16日
DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning
Arxiv
19+阅读 · 2018年1月8日
Natural Language Processing: State of The Art, Current Trends and Challenges
Arxiv
4+阅读 · 2017年8月17日
大家都在搜
汽车智能化
笛卡尔
大型语言模型
时间序列
全面综述
智能推荐
RE-NET
palantir
无人艇
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top