本教程将是关于无监督学习和强化学习的交叉。随着自然语言处理中基于语言模型的预训练和计算机视觉中的对比学习的出现,无监督学习(UL)在过去几年中真正得到了发展。在这些领域中,无监督预训练的一些主要优势是在下游有监督学习任务中出现的数据效率。在如何将这些技术应用于强化学习和机器人方面,社区中有很多人感兴趣。考虑到问题的连续决策性质,RL和机器人技术比被动地从互联网上的图像和文本中学习面临更大的挑战,它可能不会那么简单。本教程将涵盖如何在强化学习中应用和使用无监督学习的基本模块,希望人们可以带回最新的最先进的技术和实践的知识,以及在这个具有挑战性和有趣的交叉领域的广泛的未来可能性和研究方向。