博客 | 深度强化学习 -- 实习岗位及企业汇总

2019 年 6 月 22 日 AI研习社

本文原载于微信公众号:深度强化学习算法 ,AI研习社经授权转载。欢迎关注 深度学习强化算法 微信公众号、及 AI研习社博客专栏

每个人在学习一门技术的时候都会关注该技术在行业中的应用前景,发展潜力以及未来的应用价值,尤其是面对特别热门的CV、NLP大量的岗位和工作实习机会,很多DRL-er开始迷茫,到底我们的前途在哪里?甚至有人开始思考,是不是已经选错方向了?

其实不然,在过去几年的学习思考中,我明白了一个道理,如果一个技术非常热门,你可以追随。但如果一门技术具有非常大的潜力,而目前很少有人精通,其实你有很大的空间成为第一批吃螃蟹的人,就看你敢不敢赌!

毕竟“容易的东西很容易就会失去,而难的才会有挑战和潜力,回报也是!”

为此,本文为大家整理一些关于深度强化学习方面的实习、工作方面的内容,希望能够帮助各位步入DRL世界的DRL-er,废话不多说,上内容。


微软亚洲研究院

地址:https://www.msra.cn/zh-cn/jobs/interns/ml-research-intern-20170605


滴滴出行

机器学习/深度学习/强化学习/自然语言处理/NLP/算法实习生

时间:2019/11/01截止

地点:
中关村软件园上地东北旺西路8号 首创空间大厦 
公司简介:
滴滴出行,中国知名的一款免费打车平台,称为手机“打车神器”,是受用户喜爱的“打车”应用。目前,滴滴已从出租车打车软件,成长为涵盖出租车、专车、快车、顺风车、代驾及大巴等多项业务在内的一站式出行平台。2014年5月20日,滴滴打车对媒体宣布,公司名称正式变更为“滴滴打车”。
职位描述

岗位职责:

1. 负责地图目的地搜索中的深度相关性模型、深度语义索引和强化学习排序引擎等领域的深度学习技术研发;

2. 负责地图目的地个性化推荐系统的深度学习推荐引擎研发。

岗位要求:

1. 本科以上学历,数学、计算机、通信等相关专业
2. 熟悉深度学习以及常见机器学习的算法,如CNN,RNN,GBDT等
3. 熟练使用Python和TensorFlow等常用深度学习工具
4. 熟练阅读相关领域英文论文并能实现
5. 拥有扎实的算法基础和良好的沟通合作解决问题的能力
6. 文本匹配、信息检索、推荐、广告领域进行过深入研究或发表过高质量论文者优先
7. 实习期3个月以上,每周至少4天,欢迎长期实习,尽快到岗者优先



腾讯AI Lab

计算机视觉/强化学习方向实习生
点:深圳

部门时间:IEG | 深圳总部 | 技术 | 2019年06月15日


公司简介:腾讯,简称:鹅厂

工作职责

  • 负责机器学习平台后台的设计与研发; 

  • 参与机器学习平台的页面设计,降低机器学习应用门槛,直到非专业用户能使用; 

  • 参与腾讯游戏智能监控场景的模型开发; 

  • 参与各算法和模型的分布式实现,丰富算法库。

工作要求

  • 硕士学历及以上,计算机、数学、人工智能等专业;

  • 熟悉Linux操作系统开发环境,熟悉C++/Python/Java;

  • 对机器学习及其在互联网行业的应用有深入的理解和浓厚的兴趣;

  • 熟悉业界主流的机器学习平台,有机器学习平台研发经验者优先;

  • 有TensorFlow/Caffe/MXNet等机器学习框架使用经验者优先;

  • 有深度学习、强化学习、海量数据处理和并行计算开发经验者优先; 

  • 具有良好的沟通能力、学习能力、分析解决问题能力;

  • 具有高度的责任心和团队合作精神。


注:腾讯的许多算法岗位,如果有强化学习经验都有机会,详情见具体的招聘主页:

https://careers.tencent.com/search.html?keyword=%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0

例如:



网易

地址:https://hr.163.com/position/detail.do?id=14750


另外,可以说网易常年招聘



阿里巴巴

网址:

https://campus.alibaba.com/traineePositions.htm?spm=a1z3e1.11874847.0.0.5d8d4928iesYei&refno=12067



蚂蚁金服




商汤科技

地址:https://www.shixiseng.com/intern/inn_rhqj0pxdpmm2



Vivo公司

强化学习研究员

地点:苏州


公司简介:vivo于2011年建立了自己的移动互联网平台,目前包括应用商店、游戏中心、浏览器、vivo官网等主要产品。
vivo移动互联网是基于vivo智能手机所打造的完整移动互联网生态圈,包括分发、广告、社区、电商、阅读、内容、运营、消费、支付、结算、线下推广等所有环节,为用户打造全方位服务生态

职位描述:

1. 根据项目需求,设计智能Agent;
2. 根据项目需求,设计策略算法
任职资格:
1. 硕士或以上学历,计算机、数学等相关专业;
2. 深度理解强化学习,模仿学习,有在实际项目中应用与优化过相关算法者优先;
3. 熟悉强化学习基本算法,使用过DQN,DDPG,GPS,TRPO等算法者优先
4. 精通C/C++、python编程,有一定的项目开发经验 ;
5. 具有较强的英文阅读能力,能够阅读英文论文和专利;
6. 具有良好的语言沟通能力,团队合作精神,上进心强,具有快速学习能力;
7. 具有论文、专利、竞赛成功的优先考虑。

地址:

https://www.zhipin.com/job_detail/26c728e8495e45741Hx52N29EVY~.html


中科院自动化研究所



Momenta公司

强化学习研发实习生

地点:苏州


公司简介:Momenta成立于2016年,是世界顶尖的自动驾驶公司。其核心技术是基于深度学习的环境感知、高精度地图、驾驶决策算法。产品包括不同级别的自动驾驶方案,以及衍生出的大数据服务。

职位描述

1. 探索强化学习的研发工作;

2. 配合实现工具链中相关接口。

岗位要求

1. 了解强化学习;

2. 了解TensorFlow,Parameter Server;

3. 了解多进程,计算机网络;

4. 熟悉Python,C++。

加分项

1. 熟悉深度强化学习常用算法及其实现;

2. 熟悉常见深度学习模型和算法;

3. 有分布式计算实践经验。


北京聚力维度

地址:https://www.nowcoder.com/job/1081


以上是部分企业的强化学习实习岗位,列举并不完整,可以微信投稿私发,以便为大家提供更多的资讯。


你可能还想看


 点击阅读原文,查看更多招募信息

登录查看更多
4

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
打怪升级!2020机器学习工程师技术路线图
专知会员服务
96+阅读 · 2020年6月3日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
197+阅读 · 2020年2月11日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
86+阅读 · 2019年10月21日
【全职&实习- 上海】量化岗位招聘公告
量化投资与机器学习
4+阅读 · 2018年7月3日
招聘 | 深度强化学习研究员/工程师
七月在线实验室
7+阅读 · 2017年12月27日
Arxiv
22+阅读 · 2018年8月30日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
25+阅读 · 2018年1月24日
Arxiv
6+阅读 · 2017年12月2日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
打怪升级!2020机器学习工程师技术路线图
专知会员服务
96+阅读 · 2020年6月3日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
197+阅读 · 2020年2月11日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
86+阅读 · 2019年10月21日
相关论文
Arxiv
22+阅读 · 2018年8月30日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
25+阅读 · 2018年1月24日
Arxiv
6+阅读 · 2017年12月2日
Arxiv
3+阅读 · 2012年11月20日
Top
微信扫码咨询专知VIP会员