如何学习良好的潜在表示是现代机器学习时代的一个重要课题。对于强化学习,使用一个好的表示使决策过程更加有效。本次演讲,我将介绍我们的工作,构建基于任务的潜在操作空间,用于基于搜索的黑盒函数优化,寻找策略变更的表示,该表示支持在不完全信息协同博弈中联合策略搜索,以及不同的表示如何影响RL探索。
视频:
https://www.youtube.com/watch?v=sH4a2a0ntUA