20分钟教会车道保持功能!Wayve 公司的强化学习算法有点牛

2018 年 8 月 1 日 新智驾


文 | 大壮旅

来自新智驾(AI-Drive)的报道


新智驾按:让AI 学会控制一辆汽车沿着道路标线行驶到底要花多久?答案是 20 分钟。鉴于许多司机花很长时间都搞不清如何开车走直线,这样的成绩确实令人惊叹。


掌握这项“技能”的是一家名为 Wayve 的英国公司,Wayve的班底都是来自剑桥大学工程学院的大牛。他们能完成这项壮举主要靠的是“强化学习”(reinforcement learning)算法。Wayve 公司在一篇博文上表示,只需一位安全司机配合,他们的算法在 15-20 分钟内就能教会一辆车沿着道路标线行驶。


所谓的强化学习又称为再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。此前,就有许多公司就展现过这项技术的高效,最好的例子就是 DeepMind 旗下横扫人类棋手的 AlphaGo 和 OpenAI 旗下迅速进步的 Dota 2 AI 机器人(每天训练量相当于人类选手 180 天)。


不可否认的是,让 AI 在复杂的棋类和即时战略类游戏中击败人类,已经让人惊掉下巴了,而在短时间内教会一辆车如何自我控制更是让人惊叹。


 Wayve 的团队成员车辆学习过程的视频上传到了公司的 YouTube 频道上,他们强调,这是世界上第一个将“强化学习带入自动驾驶汽车的范例”。


从视频我们可以看到,最初车辆会像婴儿一样蹒跚学步,在路上蜿蜒前行,但当车辆开始偏离标线,安全驾驶员就会及时介入,将车辆拉回原来的轨道。这样一来,车载算法就知道自己犯了错误,而如果算法长时间不犯错,它们还会拿到奖励的“糖豆”。

除了强化学习,Wayve 还用到了“深度卷积神经网络”,它能接收单图片输入,只靠一块车载 GPU 就能完成数据处理。与其他自动驾驶汽车不同,Wayve 的改装版雷诺小车不需要“海量模型、武装到牙齿的传感器和无穷无尽的数据”,它只需秉承 Wayve 的原则,使用“一个聪明的训练程序,就能快速和高效的完成学习任务。”


今年 5 月份,该团队还参加了 TechCrunch 大会,该公司的联合创始人 Amar Shah 当时介绍“我们想赋予自动驾驶汽车的是更棒的大脑,而不是更多的硬件。”


“下一步,我们的任务就是扩展这项技术,以应对更多更复杂的驾驶任务,毕竟现在 AI 只不过学会了车道保持这项功能而已。未来,我们希望这套系统能驱动车辆识别交通灯,在环形道路和十字路口应对自如。”Amar Shah 解释道。【完】


推荐阅读:


MIT开发MapLite系统,让自动驾驶汽车深入没有3D地图的乡间小路


最新「大咖Live」预告:


8月4日早上10点禾多科技产品总监毛涛,将为我们讲解智能代客泊车的现状和未来。扫码进入,等你来听。


「大咖Live」往期嘉宾(部分):图灵奖得主门生、OUERS 谭章熹;Roadstar.ai首席科学家周光;宽凳科技CEO、前百度副总裁刘骏;煜炜光学首席技术专家张石;黑芝麻科技CEO 单记章等。(音频内容皆已上线,扫码进入)


我们将继续每周邀请一位一线从业者带来项目实践过程中的方法和思路,为智能驾驶从业者与投资人、分析师提供行业参考。另,视觉技术专题研报也将在8月放出,新智驾年度会员可免费查阅,敬请期待。

登录查看更多
1

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
多智能体深度强化学习的若干关键科学问题
专知会员服务
190+阅读 · 2020年5月24日
《强化学习》简介小册,24页pdf
专知会员服务
274+阅读 · 2020年4月19日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
77+阅读 · 2020年3月15日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
174+阅读 · 2020年2月8日
【强化学习】深度强化学习初学者指南
专知会员服务
182+阅读 · 2019年12月14日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
30+阅读 · 2019年7月7日
快速上手深度强化学习?学会TensorForce就够了
“黑”掉自动驾驶汽车,只要给路标涂个大花脸
无人驾驶汽车
劲说
6+阅读 · 2016年8月26日
Learning in the Frequency Domain
Arxiv
11+阅读 · 2020年3月12日
The Matrix Calculus You Need For Deep Learning
Arxiv
12+阅读 · 2018年7月2日
Arxiv
5+阅读 · 2018年2月26日
VIP会员
相关VIP内容
多智能体深度强化学习的若干关键科学问题
专知会员服务
190+阅读 · 2020年5月24日
《强化学习》简介小册,24页pdf
专知会员服务
274+阅读 · 2020年4月19日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
77+阅读 · 2020年3月15日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
174+阅读 · 2020年2月8日
【强化学习】深度强化学习初学者指南
专知会员服务
182+阅读 · 2019年12月14日
Top
微信扫码咨询专知VIP会员