北京时间12月12日(周六)9:00,FAIR研究员/研究经理—田渊栋博士将携手团队小伙伴布朗大学在读博士生—王林楠,与大家相约线上在云端相见,分享他们在NeurIPS 2020中的精彩工作。
一张图告诉你
活动信息
福利预告:入群可参与会议讨论,
获取直播地址、回放视频、课件,
还有不定期红包发放哦~
嘉宾介绍
▼
田 渊 栋
#Facebook人工智能研究院
研究员/研究经理
田渊栋博士,脸书(Facebook)人工智能研究院研究员及经理,研究方向为深度强化学习,多智能体学习,及其在游戏中的应用,和深度学习模型的理论分析。
围棋开源项目DarkForest及ELF OpenGo项目中研究及工程负责人和第一作者。2013-2014年在Google无人驾驶团队任软件工程师。
2005年及08年于上海交通大学获本硕学位,2013年于美国卡耐基梅隆大学机器人研究所获博士学位。曾获得2013年国际计算机视觉大会(ICCV)马尔奖提名(Marr Prize Honorable Mentions)
个人主页:
https://yuandong-tian.com/
王 林 楠
# 布朗大学 在读博士生
王林楠是布朗大学第四年博士生,他的研究方向为人工智能和超级计算。他的目标就是让人工智能全民化,能够让任何人、任何公司只需要点击几次鼠标就能设计,部署一个可行的人工智能系统。
为了实现这个目标,他一直致力于建立一个基于蒙特卡洛树搜索的人工智能,来设计不同的人工智能给大众。通过四年的努力,他们已经围绕蒙特卡洛树搜索建立了一个完整的神经网络结构搜索系统去实现这个目标。
算法层面上,他和田渊栋一起提出了一个全新的黑盒优化算法(隐动作集蒙特卡洛树搜索)。工程实现上,他们开源了包含一个分布式搜索框架可以轻松扩展上百个GPU去搜索当下模型的SoTA,同时也包含一个能够在几个GPU上快速得出一个可行模型的框架。
他也和Jack Dongarra实验室在超级计算领域有着密切的合作, 曾参与开发Open MPI的迭代。除此之外,他还独立开发BLASX来解决大规模多GPU矩阵运算,比NVIDIA收费的cuBLASXT平均快30%。他的SuperNeurons系列开发了一个神经网络框架给超级计算机,并拥有一套动态调度系统来突破大规模神经网络训练的内存瓶颈,是这个方向最早期的工作之一。
个人主页:
NeurIPS 2020工作抢先看
▼
①
不完美信息下
用于提高多智能体合作效能的联合策略搜索
本文找到了一个“策略变化密度”的局部量,使用策略变化密度,可以将策略改变造成的得分改变写成只依赖于被修改的信息集,从而极大地简化了表达式,在此基础上,本文提出了联合策略搜索算法,并在两人合作简单不完美信息游戏,及桥牌的叫牌上进行了测试。在桥牌叫牌的任务上我们训练得到了一个比之前最好结果更好的叫牌AI,在四明手测试上超过了曾获奖多次的软件WBridge5,平均每盘的国际比赛分差距为+0.63±0.22(1000局)。
论文链接:
https://arxiv.org/abs/2008.06495
代码链接:
https://github.com/facebookresearch/jps
更多参考资料:
https://zhuanlan.zhihu.com/p/259536418
https://yuandong-tian.com/jps_short_video.mp4
②
LA-MCTS:
基于蒙特卡洛树搜索 (MCTS) 的全新黑盒优化算法
在实际问题中,黑盒优化适用的场景往往是函数调用开销非常大且没有导数信息的情形,比如说函数值是一个复杂系统运转一天后的平均效率,或者是耗费巨资才可获得的一个实验结果,等等,通过降低最优解的样本复杂度,可以极大地降低成本提高效率。
论文链接:
https://arxiv.org/abs/2007.00708
都看到这里了,还不快来报名嘛!
扫描下方二维码或点击“阅读原文”,
你离大佬只有一步之遥!
更多机构专场活动正在路上……
TechBeat(www.techbeat.net)是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区
扫二维码|关注我们
微信:thejiangmen
bp@thejiangmen.com
点击“❀在看”,让更多朋友们看到吧~