【网易伏羲】强化学习研究员

2022 年 3 月 25 日 深度强化学习实验室

来源:网易伏羲实验室

职位描述

你可以:

  1. 从事游戏AI相关的强化学习应用研究,将学术研究成果转成可行的技术方案,用强化学习赋予游戏更多生命力

  2. 在强化学习领域进行创新性研究,发表高质量论文或撰写专利,成为精专的强化学习宗师

  3. 从事强化学习交叉学科应用研究,用强化学习技术赋能NLP、视觉图像、用户画像等相关的业务应用,让强化学习成为先进生产力

职位要求

我们希望你具备以下条件:

  1. 计算机或相关专业硕士以上学历,扎实的深度学习及强化学习知识基础,保持对领域最前沿技术的追踪

  2. 编程基础扎实,能熟练使用主流深度学习框架,如tensorflow、pytorch等,具备实现常用的(深度)强化学习算法能力

  3. 有在人工智能和机器学习相关顶级会议或期刊(ICML、NeurIPS、ICLR、IJCAI、AAAI、AAMAS、CoRL、AIJ、JMLR、JAAMAS等)发表论文者更佳

  4. 有一定的游戏经历,热爱人工智能、热爱游戏,具备良好的沟通能力,具有良好的大局观和协作能力

  5. 熟悉以下强化学习相关领域(并不限于), 有相关经验者尤佳:Reinforcement Learning Theory, Model-based RL, Offline RL、Imitation Learning, Evolutionary RL, Hierarchical RL, Multi-Task RL, Meta RL, Transfer Learning, Distributional RL, Episodic RL, Multi-Agent RL, Game Theory, Planning, Multi-Arm Bandit.

简历投递

https://hr.163.com/job-detail.html?id=14918&lang=zh

职位描述

  • 优化强化学习SDK、分布式强化学习训练和部署框架的设计,开发强化学习训练和部署平台;

  • 设计并实现面向智能体编程(Agent oriented programming),开发智能体强化学习能力;

  • 基于强化学习、模仿学习等AI技术为游戏产品打造更强力、更多样、更拟人的AI机器人;

  • 探索伏羲元宇宙,培养Metaverse中每一个虚拟智能体都能具备强大的认知决策能力;

    职位要求

  • 计算机及相关专业背景硕士及以上学历,热爱游戏行业,热爱人工智能技术;

  • 两年以上相关工作经验,包括但不限于使用强化学习、模仿学习等技术解决行业内实际问题;

  • 熟悉强化学习、模仿学习等常用算法,熟练掌握至少两种常见的深度学习框架,如TensorFlow/PyTorch/MXNet/Keras等;

  • 熟练掌握至少两种常见的计算机编程语言,如Python、C++、C#、Lua、Java等,编程基础扎实,有ACM竞赛获奖或者开源经历者优先;

  • 有强化学习SDK、分布式强化学习训练和部署框架、强化学习训练和部署平台设计经验和开发经验者优先;

  • 在人工智能顶级会议(NIPS/ICML/ICLR/AAAI/IJCAI/AMMAS/ICRA等)或顶级期刊上有论文发表者优先;

  • 具有优秀的沟通合作能力,热爱技术并善于钻研,能主动思考,有解决疑难问题的毅力和决心;

  • 具有优秀的逻辑思维和创新意识,擅长分析用户需求,有出色的组织协调能力,能很好的跨团队协作;

  • 具备优秀的学习能力,做事专注、精益求精、认真负责,有耐心,有上进心,乐于接受新事物;

申请方式

https://hr.163.com/job-detail.html?id=36251&lang=zh


点击“阅读原文”,了解更多

登录查看更多
1

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
斯坦福大学最新【强化学习】2022课程,含ppt
专知会员服务
124+阅读 · 2022年2月27日
【2022新书】强化学习工业应用,408页pdf
专知会员服务
226+阅读 · 2022年2月3日
【微信@CIKM2021 】 强化学习推荐模型的知识蒸馏探索之路
专知会员服务
32+阅读 · 2021年9月7日
【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
27+阅读 · 2020年5月25日
【腾讯】TEG11-强化学习算法研究员
深度强化学习实验室
0+阅读 · 2022年3月25日
【阿里】游戏AI工程师-强化学习方向
深度强化学习实验室
0+阅读 · 2022年3月25日
【微软亚洲研究院】招聘强化学习方向实习生
深度强化学习实验室
1+阅读 · 2022年3月25日
平安 | 图神经网络/强化学习招聘
图与推荐
0+阅读 · 2021年9月23日
微软亚洲互联网工程院NLP 组招聘科研实习生!
夕小瑶的卖萌屋
0+阅读 · 2021年8月12日
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Arxiv
22+阅读 · 2018年8月30日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关资讯
【腾讯】TEG11-强化学习算法研究员
深度强化学习实验室
0+阅读 · 2022年3月25日
【阿里】游戏AI工程师-强化学习方向
深度强化学习实验室
0+阅读 · 2022年3月25日
【微软亚洲研究院】招聘强化学习方向实习生
深度强化学习实验室
1+阅读 · 2022年3月25日
平安 | 图神经网络/强化学习招聘
图与推荐
0+阅读 · 2021年9月23日
微软亚洲互联网工程院NLP 组招聘科研实习生!
夕小瑶的卖萌屋
0+阅读 · 2021年8月12日
相关基金
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员