博客 | 深度强化学习 -- 实习岗位及企业汇总

会员服务 ·

博客 | 深度强化学习 -- 实习岗位及企业汇总

2019 年 6 月 22 日 AI研习社

本文原载于微信公众号：深度强化学习算法 ，AI研习社经授权转载。欢迎关注 深度学习强化算法微信公众号、及 AI研习社博客专栏。

每个人在学习一门技术的时候都会关注该技术在行业中的应用前景，发展潜力以及未来的应用价值，尤其是面对特别热门的CV、NLP大量的岗位和工作实习机会，很多DRL-er开始迷茫，到底我们的前途在哪里？甚至有人开始思考，是不是已经选错方向了？

其实不然，在过去几年的学习思考中，我明白了一个道理，如果一个技术非常热门，你可以追随。但如果一门技术具有非常大的潜力，而目前很少有人精通，其实你有很大的空间成为第一批吃螃蟹的人，就看你敢不敢赌！

毕竟“容易的东西很容易就会失去，而难的才会有挑战和潜力，回报也是！”

为此，本文为大家整理一些关于深度强化学习方面的实习、工作方面的内容，希望能够帮助各位步入DRL世界的DRL-er，废话不多说，上内容。

微软亚洲研究院

地址：https://www.msra.cn/zh-cn/jobs/interns/ml-research-intern-20170605

滴滴出行

机器学习/深度学习/强化学习/自然语言处理/NLP/算法实习生

时间：2019/11/01截止

地点：

中关村软件园上地东北旺西路8号首创空间大厦

公司简介：

滴滴出行，中国知名的一款免费打车平台，称为手机“打车神器”，是受用户喜爱的“打车”应用。目前，滴滴已从出租车打车软件，成长为涵盖出租车、专车、快车、顺风车、代驾及大巴等多项业务在内的一站式出行平台。2014年5月20日，滴滴打车对媒体宣布，公司名称正式变更为“滴滴打车”。

职位描述

岗位职责：

1. 负责地图目的地搜索中的深度相关性模型、深度语义索引和强化学习排序引擎等领域的深度学习技术研发；

2. 负责地图目的地个性化推荐系统的深度学习推荐引擎研发。

岗位要求：

1. 本科以上学历，数学、计算机、通信等相关专业
2. 熟悉深度学习以及常见机器学习的算法，如CNN，RNN，GBDT等
3. 熟练使用Python和TensorFlow等常用深度学习工具
4. 熟练阅读相关领域英文论文并能实现
5. 拥有扎实的算法基础和良好的沟通合作解决问题的能力
6. 文本匹配、信息检索、推荐、广告领域进行过深入研究或发表过高质量论文者优先
7. 实习期3个月以上，每周至少4天，欢迎长期实习，尽快到岗者优先

腾讯AI Lab

计算机视觉/强化学习方向实习生

地

点：深圳

部门时间：IEG | 深圳总部 | 技术 | 2019年06月15日

公司简介：腾讯，简称：鹅厂

工作职责

负责机器学习平台后台的设计与研发；
参与机器学习平台的页面设计，降低机器学习应用门槛，直到非专业用户能使用；
参与腾讯游戏智能监控场景的模型开发；
参与各算法和模型的分布式实现，丰富算法库。

工作要求

硕士学历及以上，计算机、数学、人工智能等专业；
熟悉Linux操作系统开发环境，熟悉C++/Python/Java；
对机器学习及其在互联网行业的应用有深入的理解和浓厚的兴趣；
熟悉业界主流的机器学习平台，有机器学习平台研发经验者优先；
有TensorFlow/Caffe/MXNet等机器学习框架使用经验者优先；
有深度学习、强化学习、海量数据处理和并行计算开发经验者优先；
具有良好的沟通能力、学习能力、分析解决问题能力；
具有高度的责任心和团队合作精神。

注：腾讯的许多算法岗位，如果有强化学习经验都有机会，详情见具体的招聘主页：

https://careers.tencent.com/search.html?keyword=%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0

例如：

网易

地址：https://hr.163.com/position/detail.do?id=14750

另外，可以说网易常年招聘

阿里巴巴

网址：

https://campus.alibaba.com/traineePositions.htm?spm=a1z3e1.11874847.0.0.5d8d4928iesYei&refno=12067

蚂蚁金服

商汤科技

地址：https://www.shixiseng.com/intern/inn_rhqj0pxdpmm2

Vivo公司

强化学习研究员

地点：苏州

公司简介：vivo于2011年建立了自己的移动互联网平台，目前包括应用商店、游戏中心、浏览器、vivo官网等主要产品。
vivo移动互联网是基于vivo智能手机所打造的完整移动互联网生态圈，包括分发、广告、社区、电商、阅读、内容、运营、消费、支付、结算、线下推广等所有环节，为用户打造全方位服务生态

职位描述：

1. 根据项目需求，设计智能Agent；
2. 根据项目需求，设计策略算法
任职资格：
1. 硕士或以上学历，计算机、数学等相关专业；
2. 深度理解强化学习，模仿学习，有在实际项目中应用与优化过相关算法者优先；
3. 熟悉强化学习基本算法，使用过DQN，DDPG，GPS，TRPO等算法者优先
4. 精通C/C++、python编程，有一定的项目开发经验；
5. 具有较强的英文阅读能力，能够阅读英文论文和专利；
6. 具有良好的语言沟通能力，团队合作精神，上进心强，具有快速学习能力；
7. 具有论文、专利、竞赛成功的优先考虑。

地址：

https://www.zhipin.com/job_detail/26c728e8495e45741Hx52N29EVY~.html

中科院自动化研究所