刘霁:延伸机器学习算法的边界 |“35岁以下科技创新35人”中国榜单专栏

2018 年 4 月 26 日 DeepTech深科技

点击图片查看2018年首批重磅评委名单及报名方式

自 1999 年起,《麻省理工科技评论》每年都会推出“35岁以下创新35人”(Innovators Under 35)榜单,旨在于全球范围内评选出被认为最有才华、最具创新精神,以及最有可能改变世界的 35 位年轻技术创新者或企业家,共分为发明家、创业家、远见者、人文关怀者及先锋者五类。


2017 年,该全球权威榜单正式推出中国区评选,并已公布并首届评选结果。现在,《麻省理工科技评论》正式开设“35岁以下创新35人”中国榜单专栏,以人物报道的形式帮助中文读者了解这些来自中国的新生代科技力量。


刘霁·远见者

延伸机器学习算法的边界


获奖年份:2017年

年龄:34 岁

职位:腾讯AI Lab专家研究员及美国罗彻斯特大学助理教授

获奖事由:让机器学习算法更准确更高效,探索人工智能潜力的边界


游戏AI的研发将会进一步拓宽人类对于AI能力的认知。作为腾讯 AI Lab 的专家工程师,刘霁正在带领团队攻克多人即时战略游戏的 AI设计问题。

这件在普通人眼里看来颇好玩的任务,实际上难度非常大。因为这样的研究最终将探索的问题是: AI 能否能够通过协作超越围棋AI这种单体智能,达到更高层次的群体智能。

这个问题的解决离不开AI 的核心领域——机器学习。而在机器学习远不如当下火热的时候,刘霁就选择了这个研究方向,一是因为他对研究通用性的方法更感兴趣,二是这个方向也更具挑战。

具体而言,
刘霁的工作涵盖了以下几个领域:异步并行算法、学习、张量完成、分散优化等时下非常重要的话题。其中,刘霁已经在异步并行算法创新上取得了不少成绩。

所谓异步并行指的是,本地机器各自进行自己的训练工作,一段时间以后将模型更新到参数服务器上,然后并不等待其他机器就进行下一轮的本地训练。这个过程的好处就是快,因为各个机器之间不需要互相等待,因此异步并行被大量使用。

刘霁提出的一系列异步并行算法,则解决了传统同步并行算法的瓶颈问题——快机等待慢机。同时,他的相关理论研究还解决了异步并行的深度学习算法中的一个开放性问题——关于异步 SGD 算法正确性和效率保证,该异步 SGD 并行算法已经广泛运用于各种主流的机器学习计算软件和平台,例如Google 开发的 Tensorflow、微软开发的 CNTK以及亚马逊开发的 MXNet 等。


图 | 刘霁


他还注意到机器学习领域的一个新趋势:传统机器学习的研究侧重于改变机器学习算法去适应已有的硬件,随着新一代可编程硬件的流行与普及,
共同设计算法和硬件正在成为工业界和学术界的关注对象。

基于此,他提出并实践了优化算法和计算硬件的联合设计的概念,开发出第一个支持“端到端”低精度运算的机器学习框架——通过降低数据精度该框架减少了通讯代价并保证高精度求解,这解决了ETH合作者在系统层面的的困扰和瓶颈。随着可编程硬件普及到云端,该框架也被实现在了亚马逊的云平台上。目前,他正在和合作者共同探索该平台在加速世界上最大的分布在南非和澳大利亚的射电望远镜阵列、以及加速大规模蛋白质组和医学与工业三维重建等研究中的应用。

除此之外,刘霁设计了机器学习中去中心化的并行计算框架。相比于传统中心化并行计算,该计算结构可以极大地减少通讯代价,相关成果已被顶级机器学习会议 NIPS 2017 收录。


刘霁用一个成语概括了这些创新的产生,那就是“厚积薄发”。“我从来不相信随便拍脑袋就能产生有价值的创新。这是一个艰苦卓绝无比煎熬的过程,简单来说就是掉头发的过程”,他幽默地说道。

回忆起自己的科研道路,其中既有刘霁自己的坚持,“更多的是幸运得在正确的时间遇到正确的人能给我指引”,刘霁说道。他在博士阶段就遇到了很多对他影响深远的老师:从Benjamin Recht教授那里学到如何寻找有价值的科研问题;从博士导师Stephen Wright看到了最纯粹的科研本质和最严谨的科研态度;从袁明教授那里学到了从一般到特殊再从特殊到一般的科研方法论;从Jerry Zhu教授那里学到了如何开拓一个全新的研究领域……

而对于自己正在从事的游戏AI的研发,刘霁认为,“这可以算是一个open research problem。这个项目主要集中研究一些即时战略游戏,比如王者荣耀、星际争霸。即时战略游戏其实要比围棋难很多,Deepmind和openAI也在研究类似的问题。对我来说这个项目的重要意义在于探求AI能力的边界”。

在游戏AI的设计中,
增强学习算法的改进将至关重要。增强学习是一种能够提高 AI 能力的核心算法,它让 AI 能够解决具有不确定性动态的决策问题(比如游戏 AI,智能投资,自动驾驶,个性化医疗),这些问题往往也更加复杂。

但是,大部分增强学习的算法研究都偏于启发式,缺乏理论支持和本质上的理解。刘霁则打破常规,把增强学习问题等价的转化成等价的 minimax 优化问题,从此建立了增强学习和优化的桥梁,很多优化的理论结果和计算方法可以更快地应用到增强学习上。该工作被 UAI (The Conference on Uncertainty in Artificial Intelligence)2015 选为 Facebook最优论文奖,相关研究和成果也正被用于研究非基因因素对于一型糖尿病的影响上。

现在,除了游戏AI的研发,刘霁仍在从事去中心化的并行计算的研究,这可能会改变当前主流机器学习平台(比如google的TensorFlow)的设计思路,同时也很有可能带来新的互联网服务方式。

值得一提的是,对于当下愈演愈烈的AI热潮,刘霁认为,自己作为AI领域科技工作者的使命是把AI转化成生产力,让AI服务于全人类,与此同时,他也有义务帮助普通大众以更科学的视角看待AI。

“普通人对于AI的看法,通常容易走向两个极端,要不是AI即将要取代人类,要不就是AI除了下下棋好像没有什么实际用处。从AI在历史上的几次大起大落的经历来看,这两种看法都过于极端,并不利于AI的发展。我对AI持有谨慎的乐观态度:AI全面影响人类的生活是大势所趋,但也还有很长的路要走。”刘霁说。



 刘霁在EmTech China上的演讲 


-End-


登录查看更多
3

相关内容

刘霁教授毕业于威斯康辛大学计算机系,现担任快手Y-tech西雅图人工智能实验室和FeDA商业化Y-tech联合实验室负责人,同时还任职于罗切斯特大学计算机系和电子工程系。他从事机器学习以及人工智能研究超过15年,研究领域涵盖了诸多分支,比如并行计算,优化,计算机视觉,图像视频分析,强化学习,游戏AI,推荐系统,在线学习,特征选取,生物医学,健康医疗,数据分析,智能家居,机器人等等。他在顶级的计算机期刊和会议上发表了超过100篇学术论文,并曾多次在顶级学术会议上荣获最优论文奖或者提名,比如:他在强化学习的研究工作荣获UAI 2015 Facebook最优学生论文奖;他的多任务学习的工作荣获SIGKDD 2010最优论文提名;他在网络逻辑推断上的工作获得IEEE-TASE 2019年度最佳论文Runner-up。他荣获2017麻省理工中国35岁以下35位最佳创新人才奖,同年还荣获IBM最优教职奖,2018年被提名为中国35岁以下AI风云人物。他的研究工作对工业界也产生了重要的影响:他在异步并行算法方面的研究奠定了现在广泛使用的深度学习工具诸如TensorFlow和PyTorch异步并行算法的理论和实践基础;他在2017年机器学习顶级会议NIPS的大会报告中首次提出将“去中心化”的并行框架用于解决深度学习中超大规模的模型训练的通讯效率,开创了全新并行思路并已被Facebook等率先采用。他领导的FeDA实验室开发的支持广告推荐的训练系统达到百T数据百亿特征的深度模型在单机训练效率在1-2小时完成。
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
131+阅读 · 2020年3月25日
 第八届中国科技大学《计算机图形学》暑期课程课件
专知会员服务
55+阅读 · 2020年3月4日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
300+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
重磅发布|清华大学创新领军工程博士长三角项目今年正式启动
清华大学研究生教育
7+阅读 · 2019年9月2日
阿里云发布机器学习平台PAI v3.0
雷锋网
12+阅读 · 2019年3月22日
国家副主席王岐山考察依图
依图科技
4+阅读 · 2018年11月26日
清华朱军教授:机器学习未来的几大挑战与目前进展
DeepTech深科技
4+阅读 · 2018年10月29日
2017人工智能创新公司50强出炉 旷视(Face++)上榜
Megvii旷视科技
3+阅读 · 2017年7月10日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
Precise Detection in Densely Packed Scenes
Arxiv
3+阅读 · 2019年4月8日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
4+阅读 · 2017年11月14日
VIP会员
相关资讯
相关论文
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
Precise Detection in Densely Packed Scenes
Arxiv
3+阅读 · 2019年4月8日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
4+阅读 · 2017年11月14日
Top
微信扫码咨询专知VIP会员