【微软2022】强化学习全球开源节挑战项目,报名截止 2022.4.4,申请成功奖励1万美金。

2022 年 3 月 15 日 深度强化学习实验室


来源:微软
编辑:DeepRLHub


The Reinforcement Learning (RL) Open Source Fest is a global online program focused on introducing students to open-source reinforcement learning programs and software development while working alongside researchers, data scientists, and engineers on the Real World Reinforcement Learning team at Microsoft Research NYC. Students will work on a four-month research programming project for either a Summer (May-August 2022) or Fall session (September – December 2022). Accepted students will receive a $10,000 USD stipend. Selected students will receive their stipend payment at the beginning of their session. Microsoft sends the payment directly to a student’s academic institution, which then disperses funds according to the institution’s guidelines.


Our goal is to bring together a diverse group of students from around the world to collectively solve open-source reinforcement learning problems and advance the state-of-the-art research and development alongside the RL community while providing open-source code written and released to benefit all.


At the end of the program, students will present each of their projects to the Microsoft Research Real World Reinforcement Learning team online.




Open-source projects 

Vowpal Wabbit (VW) is an open-source machine learning library created by John Langford and developed by Microsoft Research with the help of many contributors. It is a fast, flexible, online, and active learning solution that empowers people to solve complex interactive machine learning problems, with a large focus on contextual bandits and reinforcement learning. It is a vehicle for both research prototyping and driving bleeding edge algorithms to production. RL OS Fest is all about open-source projects in the Vowpal Wabbit ecosystem.


项目列表:

https://vowpalwabbit.org/rlos/2022/projects


Eligibility

To be eligible for the program, students must be enrolled in or accepted into an accredited institution including colleges, universities, Master programs, PhD programs, and undergraduate programs.


Student responsibilities during the program

  • Submit quality work: code compiles, has unit tests and documentation, and passes code review

  • Regularly communicate work completed, what you intend to do next, and blockers

  • Re-evaluate project tasks if you’re significantly ahead or behind schedule

  • Regular check-ins with your mentor/collaborator

  • Listen and respond to feedback

  • Pro-active learning


Program Timeline

*The upcoming program dates are subject to change, and will be finalized and updated here by March 1, 2022


March 1, 2022 | Application period opens
April 4, 2022 | Application period closes

April 25, 2022 | Selected applicants notified
May 9, 2022| Summer projects begin
August 15, 2022 | Summer project presentations

September 12, 2022| Fall projects begin
December 2, 2022 | Fall project presentations



更多详情查看微软官网

https://www.microsoft.com/en-us/research/academic-program/rl-open-source-fest/


登录查看更多
0

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
39+阅读 · 2021年6月29日
专知会员服务
39+阅读 · 2020年9月6日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
微软招聘祝大家春节快乐!
微软招聘
0+阅读 · 2022年1月31日
微软校招 | 2022暑期实习招聘正式启动!
微软招聘
0+阅读 · 2022年1月10日
微软办公环境大揭秘!
微软招聘
0+阅读 · 2021年12月24日
微软2022校招正式启动!
微软招聘
0+阅读 · 2021年8月16日
田厂秋招正式开启还剩1天!
微软招聘
0+阅读 · 2021年8月15日
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
Arxiv
58+阅读 · 2021年11月15日
Arxiv
16+阅读 · 2021年7月18日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
151+阅读 · 2017年8月1日
VIP会员
相关VIP内容
专知会员服务
39+阅读 · 2021年6月29日
专知会员服务
39+阅读 · 2020年9月6日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
微软招聘祝大家春节快乐!
微软招聘
0+阅读 · 2022年1月31日
微软校招 | 2022暑期实习招聘正式启动!
微软招聘
0+阅读 · 2022年1月10日
微软办公环境大揭秘!
微软招聘
0+阅读 · 2021年12月24日
微软2022校招正式启动!
微软招聘
0+阅读 · 2021年8月16日
田厂秋招正式开启还剩1天!
微软招聘
0+阅读 · 2021年8月15日
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
相关论文
Arxiv
58+阅读 · 2021年11月15日
Arxiv
16+阅读 · 2021年7月18日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
151+阅读 · 2017年8月1日
Top
微信扫码咨询专知VIP会员