【网易伏羲】强化学习研究员 - 专知

会员服务 ·

0

【网易伏羲】强化学习研究员

2022 年 3 月 25 日 深度强化学习实验室

来源：网易伏羲实验室

职位描述

你可以：

从事游戏AI相关的强化学习应用研究，将学术研究成果转成可行的技术方案，用强化学习赋予游戏更多生命力
在强化学习领域进行创新性研究，发表高质量论文或撰写专利，成为精专的强化学习宗师
从事强化学习交叉学科应用研究，用强化学习技术赋能NLP、视觉图像、用户画像等相关的业务应用，让强化学习成为先进生产力

职位要求

我们希望你具备以下条件：

计算机或相关专业硕士以上学历，扎实的深度学习及强化学习知识基础，保持对领域最前沿技术的追踪
编程基础扎实，能熟练使用主流深度学习框架，如tensorflow、pytorch等，具备实现常用的（深度）强化学习算法能力
有在人工智能和机器学习相关顶级会议或期刊（ICML、NeurIPS、ICLR、IJCAI、AAAI、AAMAS、CoRL、AIJ、JMLR、JAAMAS等）发表论文者更佳
有一定的游戏经历，热爱人工智能、热爱游戏，具备良好的沟通能力，具有良好的大局观和协作能力
熟悉以下强化学习相关领域（并不限于），有相关经验者尤佳：Reinforcement Learning Theory, Model-based RL, Offline RL、Imitation Learning, Evolutionary RL, Hierarchical RL, Multi-Task RL, Meta RL, Transfer Learning, Distributional RL, Episodic RL, Multi-Agent RL, Game Theory, Planning, Multi-Arm Bandit.

简历投递

https://hr.163.com/job-detail.html?id=14918&lang=zh

职位描述

优化强化学习SDK、分布式强化学习训练和部署框架的设计，开发强化学习训练和部署平台；
设计并实现面向智能体编程（Agent oriented programming），开发智能体强化学习能力；
基于强化学习、模仿学习等AI技术为游戏产品打造更强力、更多样、更拟人的AI机器人；
探索伏羲元宇宙，培养Metaverse中每一个虚拟智能体都能具备强大的认知决策能力；
职位要求
计算机及相关专业背景硕士及以上学历，热爱游戏行业，热爱人工智能技术；
两年以上相关工作经验，包括但不限于使用强化学习、模仿学习等技术解决行业内实际问题；
熟悉强化学习、模仿学习等常用算法，熟练掌握至少两种常见的深度学习框架，如TensorFlow/PyTorch/MXNet/Keras等；
熟练掌握至少两种常见的计算机编程语言，如Python、C++、C#、Lua、Java等，编程基础扎实，有ACM竞赛获奖或者开源经历者优先；
有强化学习SDK、分布式强化学习训练和部署框架、强化学习训练和部署平台设计经验和开发经验者优先；
在人工智能顶级会议（NIPS/ICML/ICLR/AAAI/IJCAI/AMMAS/ICRA等）或顶级期刊上有论文发表者优先；
具有优秀的沟通合作能力，热爱技术并善于钻研，能主动思考，有解决疑难问题的毅力和决心；
具有优秀的逻辑思维和创新意识，擅长分析用户需求，有出色的组织协调能力，能很好的跨团队协作；
具备优秀的学习能力，做事专注、精益求精、认真负责，有耐心，有上进心，乐于接受新事物；

申请方式

https://hr.163.com/job-detail.html?id=36251&lang=zh

点击“阅读原文”，了解更多

登录查看更多

1

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

【2022新书】强化学习工业应用，408页pdf

【2022新书】强化学习工业应用，408页pdf

专知会员服务

231+阅读 · 2022年2月3日

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

专知会员服务

28+阅读 · 2021年12月4日

DeepMind、UCL新课上线，多位科学家携手打造深度强化学习课程

DeepMind、UCL新课上线，多位科学家携手打造深度强化学习课程

专知会员服务

65+阅读 · 2021年9月11日

【ICML2021】逆约束强化学习

专知会员服务

33+阅读 · 2021年9月7日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

76+阅读 · 2021年1月23日

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

专知会员服务

28+阅读 · 2020年5月25日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【NeurIPS 2019-教程】强化学习:过去、现在和未来展望（Rinforcement Learning: Past, Present, and Future Perspectives），微软首席研究员Katja Hofmann

【NeurIPS 2019-教程】强化学习:过去、现在和未来展望（Rinforcement Learning: Past, Present, and Future Perspectives），微软首席研究员Katja Hofmann

专知会员服务

59+阅读 · 2019年12月9日

杭州/北京内推 | 蚂蚁集团智能决策团队招聘运筹优化算法工程师/实习生

杭州/北京内推 | 蚂蚁集团智能决策团队招聘运筹优化算法工程师/实习生

PaperWeekly

1+阅读 · 2022年4月7日

【腾讯】TEG11-强化学习算法研究员

【腾讯】TEG11-强化学习算法研究员

深度强化学习实验室

0+阅读 · 2022年3月25日

【阿里】游戏AI工程师-强化学习方向

【阿里】游戏AI工程师-强化学习方向

深度强化学习实验室

0+阅读 · 2022年3月25日

【微软亚洲研究院】招聘强化学习方向实习生

【微软亚洲研究院】招聘强化学习方向实习生

深度强化学习实验室

1+阅读 · 2022年3月25日

北京内推 | 微软亚洲研究院DKI组王露研究员招聘强化学习方向研究实习生

北京内推 | 微软亚洲研究院DKI组王露研究员招聘强化学习方向研究实习生

PaperWeekly

0+阅读 · 2022年3月25日

腾讯优图实验室招聘计算机视觉研究员和实习生

腾讯优图实验室招聘计算机视觉研究员和实习生

CVer

0+阅读 · 2022年1月17日

北京内推 | 微软亚洲互联网工程院（STCA）招聘NLP科研实习生

北京内推 | 微软亚洲互联网工程院（STCA）招聘NLP科研实习生

PaperWeekly

0+阅读 · 2021年11月26日

北京内推 | 360人工智能研究院招聘计算机视觉算法研究员

北京内推 | 360人工智能研究院招聘计算机视觉算法研究员

PaperWeekly

0+阅读 · 2021年10月11日

平安 | 图神经网络/强化学习招聘

平安 | 图神经网络/强化学习招聘

图与推荐

0+阅读 · 2021年9月23日

微软亚洲互联网工程院NLP 组招聘科研实习生！

微软亚洲互联网工程院NLP 组招聘科研实习生！

夕小瑶的卖萌屋

0+阅读 · 2021年8月12日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

先进脑机接口理论与脑控康复车实现技术研究

国家自然科学基金

5+阅读 · 2013年12月31日

基于实物模型的多智能体群避撞与汇聚性的协同控制研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

强化学习迁移技术及其在交互式游戏中的应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于模糊定性强化学习的复杂不确定系统的模糊协调控制机理研究

国家自然科学基金

3+阅读 · 2009年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

关系学习及其应用的研究

国家自然科学基金

1+阅读 · 2008年12月31日

Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning

Arxiv

1+阅读 · 2022年4月20日

Auto-Icon+: An Automated End-to-End Code Generation Tool for Icon Designs in UI Development

Arxiv

0+阅读 · 2022年4月19日

INFOrmation Prioritization through EmPOWERment in Visual Model-Based RL

Arxiv

0+阅读 · 2022年4月18日

Deep Interactive Bayesian Reinforcement Learning via Meta-Learning

Arxiv

1+阅读 · 2022年4月15日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration

Arxiv

12+阅读 · 2021年2月7日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

相关VIP内容

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

【2022新书】强化学习工业应用，408页pdf

【2022新书】强化学习工业应用，408页pdf

专知会员服务

231+阅读 · 2022年2月3日

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

专知会员服务

28+阅读 · 2021年12月4日

DeepMind、UCL新课上线，多位科学家携手打造深度强化学习课程

DeepMind、UCL新课上线，多位科学家携手打造深度强化学习课程

专知会员服务

65+阅读 · 2021年9月11日

【ICML2021】逆约束强化学习

专知会员服务

33+阅读 · 2021年9月7日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

76+阅读 · 2021年1月23日

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

专知会员服务

28+阅读 · 2020年5月25日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【NeurIPS 2019-教程】强化学习:过去、现在和未来展望（Rinforcement Learning: Past, Present, and Future Perspectives），微软首席研究员Katja Hofmann

【NeurIPS 2019-教程】强化学习:过去、现在和未来展望（Rinforcement Learning: Past, Present, and Future Perspectives），微软首席研究员Katja Hofmann

专知会员服务

59+阅读 · 2019年12月9日

热门VIP内容

开通专知VIP会员享更多权益服务

【伯克利博士论文】通过真实世界实践赋能机器人自主性

军用无人机集群技术尚未成熟——但潜力可期

人工智能安全治理白皮书（2025）

AgentOps综述：分类、挑战与未来方向

相关资讯

杭州/北京内推 | 蚂蚁集团智能决策团队招聘运筹优化算法工程师/实习生

杭州/北京内推 | 蚂蚁集团智能决策团队招聘运筹优化算法工程师/实习生

PaperWeekly

1+阅读 · 2022年4月7日

【腾讯】TEG11-强化学习算法研究员

【腾讯】TEG11-强化学习算法研究员

深度强化学习实验室

0+阅读 · 2022年3月25日

【阿里】游戏AI工程师-强化学习方向

【阿里】游戏AI工程师-强化学习方向

深度强化学习实验室

0+阅读 · 2022年3月25日

【微软亚洲研究院】招聘强化学习方向实习生

【微软亚洲研究院】招聘强化学习方向实习生

深度强化学习实验室

1+阅读 · 2022年3月25日

北京内推 | 微软亚洲研究院DKI组王露研究员招聘强化学习方向研究实习生

北京内推 | 微软亚洲研究院DKI组王露研究员招聘强化学习方向研究实习生

PaperWeekly

0+阅读 · 2022年3月25日

腾讯优图实验室招聘计算机视觉研究员和实习生

腾讯优图实验室招聘计算机视觉研究员和实习生

CVer

0+阅读 · 2022年1月17日

北京内推 | 微软亚洲互联网工程院（STCA）招聘NLP科研实习生

北京内推 | 微软亚洲互联网工程院（STCA）招聘NLP科研实习生

PaperWeekly

0+阅读 · 2021年11月26日

北京内推 | 360人工智能研究院招聘计算机视觉算法研究员

北京内推 | 360人工智能研究院招聘计算机视觉算法研究员

PaperWeekly

0+阅读 · 2021年10月11日

平安 | 图神经网络/强化学习招聘

平安 | 图神经网络/强化学习招聘

图与推荐

0+阅读 · 2021年9月23日

微软亚洲互联网工程院NLP 组招聘科研实习生！

微软亚洲互联网工程院NLP 组招聘科研实习生！

夕小瑶的卖萌屋

0+阅读 · 2021年8月12日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

先进脑机接口理论与脑控康复车实现技术研究

国家自然科学基金

5+阅读 · 2013年12月31日

基于实物模型的多智能体群避撞与汇聚性的协同控制研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

强化学习迁移技术及其在交互式游戏中的应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于模糊定性强化学习的复杂不确定系统的模糊协调控制机理研究

国家自然科学基金

3+阅读 · 2009年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

关系学习及其应用的研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning

Arxiv

1+阅读 · 2022年4月20日

Auto-Icon+: An Automated End-to-End Code Generation Tool for Icon Designs in UI Development

Arxiv

0+阅读 · 2022年4月19日

INFOrmation Prioritization through EmPOWERment in Visual Model-Based RL

Arxiv

0+阅读 · 2022年4月18日

Deep Interactive Bayesian Reinforcement Learning via Meta-Learning

Arxiv

1+阅读 · 2022年4月15日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration

Arxiv

12+阅读 · 2021年2月7日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

大家都在搜

大型语言模型

国防科技创新

软件无线电

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员