基于模型的强化学习中,如果使用概率模型,为什么不需要考虑输出状态各维之间的协方差?

基于模型的强化学习中,如果使用概率模型,如MBPO。如果将模型输出定义为一个多维高斯分布,为什么都没有考虑输出的各个维度之间的协方差呢?(协方差为对角…
关注者
4
被浏览
147
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

这是为了做简化,如果考虑协方差,实现起来很麻烦