强化学习 (Reinforcement Learning)

基于模型的强化学习中，如果使用概率模型，为什么不需要考虑输出状态各维之间的协方差？

基于模型的强化学习中，如果使用概率模型，如MBPO。如果将模型输出定义为一个多维高斯分布，为什么都没有考虑输出的各个维度之间的协方差呢？（协方差为对角…

关注者

4

被浏览

147

登录后你可以

不限量看优质回答私信答主深度交流精彩内容一键收藏

查看全部 1 个回答

这是为了做简化，如果考虑协方差，实现起来很麻烦

发布于 2021-09-28 16:11

查看全部 1 个回答