《强化学习》简介小册，24页pdf - 专知

会员服务 ·

0

《强化学习》简介小册，24页pdf

2020 年 4 月 19 日 专知

强化一词来源于实验心理学中对动物学习的研究，它指的是某一事件的发生，与某一反应之间有恰当的关系，而这一事件往往会增加该反应在相同情况下再次发生的可能性。虽然心理学家没有使用“强化学习”这个术语，但它已经被人工智能和工程领域的理论家广泛采用，用来指代基于这一强化原理的学习任务和算法。最简单的强化学习方法使用的是一个常识，即如果一个行为之后出现了一个令人满意的状态，或者一个状态的改善，那么产生该行为的倾向就会得到加强。强化学习的概念在工程领域已经存在了几十年(如Mendel和McClaren 1970)，在人工智能领域也已经存在了几十年(Minsky 1954, 1961;撒母耳1959;图灵1950)。然而，直到最近，强化学习方法的发展和应用才在这些领域占据了大量的研究人员。激发这种兴趣的是两个基本的挑战:1) 设计能够在复杂动态环境中在不确定性下运行的自主机器人代理，2) 为非常大规模的动态决策问题找到有用的近似解。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“强化学习小册” 就可以获取《《强化学习》简介小册，24页pdf》专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【硬核书】不完全信息决策理论，467页pdf

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

361+阅读 · 2020年6月24日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

231+阅读 · 2020年4月28日

强化学习和最优控制的《十个关键点》81页PPT汇总

强化学习和最优控制的《十个关键点》81页PPT汇总

专知会员服务

107+阅读 · 2020年3月2日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

280+阅读 · 2019年10月9日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

119+阅读 · 2020年1月29日

强化学习与决策：RLDM2019会议笔记 - 附65页笔记PDF

强化学习与决策：RLDM2019会议笔记 - 附65页笔记PDF

专知

22+阅读 · 2019年7月15日

【资源推荐】Machine Learning基础学习资源汇总

【资源推荐】Machine Learning基础学习资源汇总

专知

30+阅读 · 2019年5月29日

自动驾驶最新综述论文（31页PDF下载）

自动驾驶最新综述论文（31页PDF下载）

专知

119+阅读 · 2019年1月15日

强化学习的未来——第一部分

强化学习的未来——第一部分

AI研习社

9+阅读 · 2019年1月2日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

【强化学习】易忽略的强化学习知识之基础知识及MDP

【强化学习】易忽略的强化学习知识之基础知识及MDP

产业智能官

19+阅读 · 2017年12月22日

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Hierarchical Meta Learning

Arxiv

9+阅读 · 2019年4月19日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Multi-task Deep Reinforcement Learning with PopArt

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

Deep Learning for Generic Object Detection: A Survey

Deep Learning for Generic Object Detection: A Survey

Arxiv

14+阅读 · 2018年9月6日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Video Person Re-identification by Temporal Residual Learning

Arxiv

5+阅读 · 2018年2月22日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

VIP会员

相关主题

相关VIP内容

【硬核书】不完全信息决策理论，467页pdf

【硬核书】不完全信息决策理论，467页pdf

专知会员服务

361+阅读 · 2020年6月24日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

231+阅读 · 2020年4月28日

强化学习和最优控制的《十个关键点》81页PPT汇总

强化学习和最优控制的《十个关键点》81页PPT汇总

专知会员服务

107+阅读 · 2020年3月2日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

280+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

119+阅读 · 2020年1月29日

强化学习与决策：RLDM2019会议笔记 - 附65页笔记PDF

强化学习与决策：RLDM2019会议笔记 - 附65页笔记PDF

专知

22+阅读 · 2019年7月15日

【资源推荐】Machine Learning基础学习资源汇总

【资源推荐】Machine Learning基础学习资源汇总

专知

30+阅读 · 2019年5月29日

自动驾驶最新综述论文（31页PDF下载）

自动驾驶最新综述论文（31页PDF下载）

专知

119+阅读 · 2019年1月15日

强化学习的未来——第一部分

强化学习的未来——第一部分

AI研习社

9+阅读 · 2019年1月2日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

【强化学习】易忽略的强化学习知识之基础知识及MDP

【强化学习】易忽略的强化学习知识之基础知识及MDP

产业智能官

19+阅读 · 2017年12月22日

相关论文

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Hierarchical Meta Learning

Arxiv

9+阅读 · 2019年4月19日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Risk-Aware Active Inverse Reinforcement Learning

Risk-Aware Active Inverse Reinforcement Learning

Arxiv

8+阅读 · 2019年1月8日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Multi-task Deep Reinforcement Learning with PopArt

Multi-task Deep Reinforcement Learning with PopArt

Arxiv

4+阅读 · 2018年9月12日

Deep Learning for Generic Object Detection: A Survey

Deep Learning for Generic Object Detection: A Survey

Arxiv

14+阅读 · 2018年9月6日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Video Person Re-identification by Temporal Residual Learning

Arxiv

5+阅读 · 2018年2月22日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

大家都在搜

大型语言模型

软件无线电

久别重逢话双塔

国防科技创新

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员