近期在推进一个智能体结合, intuition,model,curiosity,inference, memory,分享一下对架构的分析与思考,与部分实验思路,实验效果
1. 部分引发思考的知识, jpg压缩,vq-vae
2. R2D2 与 SAC
3. 基础架构
4. 实现方案思考
5. 实验的思考
6. metrpo 与 ICM 的参考
7. 优化代码,提高速度
8. 实验设计与反思
欢迎加入打卡群自律学习强化学习,请参考公众号createAmind菜单说明