这篇文章是关于实践中的强化学习领域的温和讨论,关于机会和挑战,涉及广泛的主题,有观点,没有技术细节。本文基于历史和最近的研究论文、调查、教程、谈话、博客、书籍、(小组)讨论和研讨会/会议。不同的读者群体,如研究人员、工程师、学生、经理、投资者、官员和想要更多地了解该领域的人,可能会发现这篇文章很有趣。在本文中,我们首先简要介绍了强化学习(RL),以及它与深度学习、机器学习和人工智能的关系。然后,我们讨论了RL的机会,特别是产品和服务、游戏、博弈、推荐系统、机器人、交通、金融和经济、医疗保健、教育、组合优化、计算机系统和科学与工程。然后我们讨论挑战,特别是1)基础 ,2)表示,3)奖励,4)勘探、5)模型,模拟、规划、和基准, 6)离线策略/离线学习,7)学会学习又名元学习,8)explainability和可解释性,9)限制,10)软件开发和部署,11)业务视角,还有更多的挑战。我们以讨论结束,试图回答:“为什么RL还没有在实践中被广泛采用?”和“在线学习什么时候有用?”