Richard S. Sutton是加拿大的一名计算机科学家,目前是阿尔伯塔大学计算机科学教授和iCORE主席。Sutton被认为是现代强化学习的奠基人之一,主要有以下几个显著的贡献,包括时间差分学习、策略梯度法、在Dyna架构, 由其主笔撰写的书:《Reinforcement Learning: An Introduction》,一直被视为强化学习领域的圣经。
该书自2014年以来一直在不停的修订和完善,今年Sutton又分享了他最新版本的强化学习入门的最新版本,内容比去年的版本丰富了很多,页数增加到548页,非常值得阅读学习。附全书下载链接:
链接: https://pan.baidu.com/s/10uPubO7Pw_IpVdcEpR97FA
密码: 5wmt
附加福利
小编认识的一位快手的HR朋友正急招深度强化学习、机器学习相关的技术人员,感兴趣的朋友可以与她联系,投递简历。
附职位介绍及联系方式。
机器学习-深度强化学习工程师/研究员
基本项
1. 教育背景:本科/研究生 学校,专业相关
2. 研究背景
● 研究方向:机器学习、模式识别、数据挖掘等
● 论文质量/数量,研究经历
加分项 (有一项及以上较突出)
1. 开源项目(github),技术博客
2. 竞赛:ACM、Kaggle/KDD等
3. 相关技术方向经验
● 强化学习,游戏AI(完全信息/非完全信息博弈),推荐系统
职位描述:
工作职责:
1、深度学习、强化学习等前沿技术方向研究,探索个性化推荐/广告、游戏AI等不同领域应用
基本要求:
1、计算机/电子/数学等相关专业 硕士及以上学历
2、机器学习/深度学习领域 2年以上 研究/应用 经验
3、较强编程能力:Python/C/C++
4、熟悉常见深度学习框架:Tensorflow/PyTorch/Caffe2
联系方式:
邮箱:yumenglei@kuaishou.com