转载来源 | 机器之心
论文地址:https://arxiv.org/pdf/2111.07631.pdf
(可点击文末阅读原文查看)
首先,游戏任务与自然语言处理任务非常不同,因此如何明确训练目标是大模型的关键步骤;
其次,由于游戏难易程度不同,如何设计合适的训练机制比较困难。训练方法应该能够处理各种游戏并确保学习不会退化。
欢迎后台留言、推荐您感兴趣的话题、内容或资讯!
如需转载或投稿,请后台私信。