强化学习应用介绍,41页报告带你快速了解RL的最新应用价值

2019 年 8 月 28 日 专知

【导读】AlphaGo的出现,消除了人们对人工智能的悲观看法,由此也促进了强化学习的发展,本文为大家编译了来自李玉喜老师的强化学习介绍,从多个领域剖析强化学习的应用价值。


原文链接:

https://arxiv.org/abs/1908.06973v1


介绍:


强化学习在日常生活的实际应用中扮演越来越重要的角色。目前,我们已经见证了强化学习在一些领域中的应用,诸如推荐系统、广告,也许还有金融领域。我们将看到强化学习在未来几年甚至更久的时间里在如下领域中的蓬勃发展。


1 推荐系统


推荐系统可以根据用户的喜好向用户推荐产品、服务、信息等。通过个性化推荐,比如向用户推荐新闻、电影、音乐、餐馆等,缓解信息过载的问题。


在以用户为中心的推荐系统中,使用自然、不冲突、透明的用户交互行为,理解并满足用户真正的需求和喜好是非常重要的。推荐系统需要评估、引出和影响用户的潜在状态,如满意度、持续的喜好、需求、兴趣、活动模式等,通过与用户的自然互动,并以用户的最大利益为出发点。强化学习将在这些方面发挥核心作用。


面向用户的强化学习面临以下问题:1)大规模的用户和交互行为,多种类用户,组合行为空间。2)交互行为的本质,像随机交互行为集合等。3)用户的潜在状态,导致高度的不可观测性和随机性。偏好,活动,个性,用户学习,外在因素,行为效应等都会提升推荐的效果,降低信噪比。4)生态系统效应,例如激励,生态系统动态,公平等。


2 计算机系统


计算机系统中的许多问题都与顺序决策有关,而手工设计则是常用的相关策略。强化学习是一种能够自动优化此类策略的方法。


近年来,深度学习在图像处理、语音处理和自然语言处理方面取得了显著的进展。如何设计神经网络体系结构已经成为了一个关键的问题。神经架构搜索就是一种基于强化学习的方法。在神经架构搜索中,RNN网络通常被用来生成神经网络描述,并经过训练,以最大限度地提高强化学习在验证数据集上的精度。


3 能源


数据中心在IT时代得到了广泛的应用,尤其是在大数据和人工智能普及之后。冷却对于数据中心的基础设施来说是必不可少的,它可以降低温度,减少热量,从而提高设备性能,降低设备损坏的可能性。目前有一些难点,比如意外事故、安全约束、有限的数据和潜在的代价昂贵的故障。强化学习是冷却数据中心的一种方法。


4 健康


AI在健康领域有许多机会和挑战,尤其是对于强化学习来说。当我们把强化学习应用到健康领域,我们需要考虑以下几个准则:首先,强化学习算法需要接触所有能够影响决策的信息。临床信息对于强化算法是很重要的。第二,有效样本量与学习策略和临床策略之间的密切程度相关; 策略越接近,有效样本量就越大。第三,要想实现良好的预测效果,必须对所学习的策略进行反思。

5 运输系统


滴滴出行、优步等在线叫车服务正在极大地改变着人们的交通方式,交通效率提升潜力巨大。拼车服务中的需求预测、路线规划和车辆管理等关键任务之一就是司机-乘客订单调度。它在调度过程中需要考虑空间范围和时间的动态变化,决定是否将可用的司机分配给附近有需求的乘客。交通运输系统与每个人密切相关,而强化学习能够提高其效率和降低运输花费。分层强化学习是一种知识表示方法,能够在多个层次进行实践抽象,并且学习和进行规划。

更多内容,请关注专知公众号(点击上方蓝色专知关注

  • 后台回复“RLALY” 就可以获取完整版材料载链接~

-END-

专 · 知


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!

欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询

请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成!560+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!

点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程

登录查看更多
1

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
最新《智能交通系统的深度强化学习》综述论文,22页pdf
《强化学习》简介小册,24页pdf
专知会员服务
272+阅读 · 2020年4月19日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
专知会员服务
103+阅读 · 2020年3月12日
专知会员服务
235+阅读 · 2020年1月23日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
【LinkedIn报告】深度自然语言处理的搜索系统,211页pdf
专知会员服务
107+阅读 · 2019年6月21日
2019社交行业研究报告
行业研究报告
5+阅读 · 2019年5月30日
视频内容理解在Hulu的应用与实践
AI前线
12+阅读 · 2019年2月16日
大讲堂 | 深度强化学习在电商推荐中的应用
AI研习社
9+阅读 · 2018年11月8日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
一文了解强化学习
AI100
15+阅读 · 2018年8月20日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
强化学习的入门之旅
机器学习研究会
6+阅读 · 2018年2月12日
【强化学习】如何开启强化学习的大门?
产业智能官
13+阅读 · 2017年9月10日
Learning in the Frequency Domain
Arxiv
11+阅读 · 2020年3月12日
Arxiv
6+阅读 · 2019年7月29日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
3+阅读 · 2018年10月5日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
Arxiv
5+阅读 · 2018年9月11日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关VIP内容
最新《智能交通系统的深度强化学习》综述论文,22页pdf
《强化学习》简介小册,24页pdf
专知会员服务
272+阅读 · 2020年4月19日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
专知会员服务
103+阅读 · 2020年3月12日
专知会员服务
235+阅读 · 2020年1月23日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
【LinkedIn报告】深度自然语言处理的搜索系统,211页pdf
专知会员服务
107+阅读 · 2019年6月21日
相关资讯
2019社交行业研究报告
行业研究报告
5+阅读 · 2019年5月30日
视频内容理解在Hulu的应用与实践
AI前线
12+阅读 · 2019年2月16日
大讲堂 | 深度强化学习在电商推荐中的应用
AI研习社
9+阅读 · 2018年11月8日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
一文了解强化学习
AI100
15+阅读 · 2018年8月20日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
强化学习的入门之旅
机器学习研究会
6+阅读 · 2018年2月12日
【强化学习】如何开启强化学习的大门?
产业智能官
13+阅读 · 2017年9月10日
相关论文
Learning in the Frequency Domain
Arxiv
11+阅读 · 2020年3月12日
Arxiv
6+阅读 · 2019年7月29日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
3+阅读 · 2018年10月5日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
Arxiv
5+阅读 · 2018年9月11日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
11+阅读 · 2018年4月25日
Top
微信扫码咨询专知VIP会员