人工智能在很多棋牌类游戏中取得了很大的成功,例如阿法狗(围棋)、Libratus(德扑)、Suphx(麻将)。斗地主却因其极大的状态空间、丰富的隐含信息、复杂的牌型和并存的合作与竞技,一直以来被认为是一个极具挑战性的领域。近日,快手AI平台部在斗地主上取得了突破,提出了首个从零开始的斗地主人工智能系统DouZero。将蒙特卡洛算法与深度学习相结合,DouZero在不借助任何人类知识的情况下,通过自博弈学习,在几天内战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。相关论文已被国际机器学习顶级会议ICML 2021接收,开源代码在GitHub上获得近千星。同时,论文作者开放了在线演示平台供研究者和斗地主爱好者体验。
论文地址: https://www.zhuanzhi.ai/paper/dbc43359396972a93961dc7b165c579c 开源地址: https://github.com/kwai/DouZero 在线体验: https://douzero.org/