旷视6号员工范浩强:高二开始实习,“兼职”读姚班,25岁在CVPR斩获第四个世界第一

2019 年 7 月 8 日 量子位
郭一璞 发自 融科资讯中心 
量子位 报道 | 公众号 QbitAI

初来乍到,这个人说话容易让人觉得“狂”。

“我们将比赛结果提交上去,果不其然,是第一名的成绩。”当他说出这句话的时候,表情没有一丝波澜,仿佛一切顺理成章。

他说的是AI顶会CVPR上的一项挑战赛结果,全球巨头都有参与,AI高手均同场竞技,第一名并不容易。

但如果你知道“他”叫范浩强

一切就非常稀疏平常。

谁是范浩强?

当初那个奥赛金牌、保送清华姚班、高二加入旷视成为6号员工的天才少年,人称小强,一度是AI界的江湖传说。

曾经,他是国际信息学奥赛(IOI)金牌获奖者,保送清华姚班,高二便受唐文斌邀请加入旷视创业,在半工半读的情况下保持姚班第一名的成绩,在大一军训时期就完成了一篇ICCV论文,一个让清华特奖得主陈立杰都感到智商被碾压的男人。

而如今,他已经是旷视研究院带领70人团队的算法总监了,带着一群平均年龄比自己大得多的研究员们,在图像算法、团队培养、商业化等各方面披荆斩棘,达成突破,研究领域涵盖人脸与指纹安全,移动端影像算法,AI计算摄影。

巨大光环之下,范浩强倒毫无自视甚高之意,打趣的说自己“本科毕业,两年工作经验,在贵司也就这样吧”。

正如清华计算机系常被称作“贵系”,这里的“贵司”当然也是指的旷视。

靠商用算法拿到学术界冠军

在范浩强的带领下,今年的CVPR NTIRE真实图像降噪挑战赛,旷视以绝对优势的运行时间和最终结果拿到了Raw-RGB组的冠军。

“图像降噪其实也是一件挺神奇的事情。” 介绍起这个被称作“超画质”的技术,范浩强如同在描述一件压箱底的宝贝。

这个技术,能够将手机拍到的充满噪点的图片:

变成和人眼看上去的效果一致,完美无瑕的样子:

而这个在学术界刚刚拿到冠军的降噪算法,范浩强团队从去年春天开始,做到去年10月完成,目前在产业界已经实现产品化,并开始商用,旷视多家客户都在自家的手机上用到了这个算法。

相比之下,拿到冠军反而是顺便的事。

范浩强说:“我们的工作当然也是基于学术界已有的基础,目前我们取得了新的进展,自然也要回馈给研究社区,以便能够让技术进一步向前发展。”

手机图像降噪算法是范浩强近几年最为得意的成果,而在此之前的本科时期,他已经在人脸识别、人脸检测方向带领团队为旷视拿下三个顶会级比赛的世界第一了。

在寝室里改变世界

回想起刚刚加入旷视的2012年,人脸识别在业界还是“不靠谱的事”,不少业界名人都认为,人脸识别这件事不可能靠机器自动完成,必须依赖人类的眼睛才能实现。

但还是个高二学生的范浩强却觉得,只有做“不靠谱的事”,才有意思,才有发展的空间。他就是怀着这样的心态,成了旷视第一个“Rer”(Researcher,算法研究员)。

就这样,人脸识别这件“不靠谱”的事情一做就是七年。

高中毕业之后,范浩强进入了清华天才辈出的姚期智班,开始了他的大学生涯。

在姚班的学习状态,范浩强自己说是“part time student, full time intern”,兼职读本科,全职实习生,一半时间在学习,一半时间在工作,就这样,还在四年间保持姚班第一的成绩。

而他的第一篇顶会论文,正是在大一军训期间完成的,从没写过论文的他一次投稿后,收到了这样的评价:

It is a shame that such a good method is not backed by a solid paper.

你方法这么好,文章写得这个德性,是一种耻辱。

然而最后,论文还是被ICCV接收。足以见得,在2013年,用神经网络做人脸识别是相当稀缺的东西。

也正是因为这篇论文,旷视拿下了ICCV 2013 300 Faces in-the-Wild Challenge人脸关键点定位的冠军,这也是旷视获得第一个技术评测世界冠军。

随后的2014年,又是大丰收的一年。范浩强先是为旷视拿下世界权威人脸检测公开评测集FDDB(Face Detection Dataset and Benchmark)人脸检测赛项的第一名。

之后,又拿下了互联网图像人脸识别竞赛LFW(Labeled Faces in the Wild)的第一名。

这项冠军来的并不容易,创业早期的旷视条件艰苦,在研究人脸识别的时候,连GPU集群都没有,范浩强独自一人在学校寝室,在从外部云服务租来的集群上训练,终于拿下了LFW(Labeled Faces in the Wild)竞赛的第一名。

正在他春风得意的时候,印奇发来一封邮件,强烈要求“不要在寝室里改变世界了,下周一务必来公司一趟”。

一年内两个冠军,加上2013年的ICCV,三个世界第一,让旷视在计算机视觉领域一举成名,原本“不靠谱”的人脸识别,也逐渐成为现实,应用在了各类机构、场景,以及千万人的手机上。

“信仰流”leader

除了研究成果不断夺冠,在范浩强读本科的这几年,旷视也处于高速发展阶段,各种产品都开始在行业内大放异彩,也成功自研了深度学习框架Brain++。

而在资本层面,范浩强在清华读书期间,旷视也不断受到创新工场、蚂蚁金服、启明创投等多家机构的青睐,迅速从A轮发展到C轮(如今已到D轮),成为行业领军的独角兽。

正是在这样飞速发展的背景之下,范浩强没有和大多数姚班同学那样继续深造,而是直接追随人脸识别浪潮,成为了旷视全职员工。

对范浩强本人来说,从实习高中生,到全职研究员,旷视也逐渐从初创公司走向行业独角兽。

“高中觉得这是个玩的东西,是个game;本科觉得是个job;毕业后觉得是个mission。在AI的商业化应用之路上,前方已经没有别人,现在轮到我们这群人来继续推动它的发展。”

而这期间,从参与旷视的建立,到完成人脸识别的一系列工作,拿下第一桶金,成为准备影响人类科技树的人,范浩强不仅拥有了“想做的事都能做成”的信心,更具备了一种使命感。

“连旷视这样的公司都被外界称作‘行业头部企业’,由此可见整个行业都需要继续被拯救。”范浩强无不戏谑地说。“以AI为代表的智能化技术将深刻的影响未来产业的格局,时代的浪潮已经把我们推到了这里,担子虽重,但是已经是到了想上也得上,不想上也得上的时候了。”

而听到范浩强这样一个毕业两年的年轻人讲述这些宏愿的时候,你会觉得他是这个时代的风云人物,有一种舍我其谁的英雄气概。不同于那个被多番吹捧少年天才,现在的他身上流露着一种历史使命感,配上插科打诨的脱口秀式表达,会觉得仿佛在会见一个影视剧里才有的形象丰满的人物。

也正是在他毕业后的这几年,旷视本身再度突破,由“Face++旷视”升级为“MEGVII旷视”,围绕核心AI技术原创深度学习框架Brain++,为个人设备大脑、城市大脑和供应链大脑三大核心应用场景赋能,推进人工智能及物联网技术与实体经济加速融合,实现前沿科技规模化商业落地。

在这样的发展进程下,生于1994年的范浩强已经是旷视这家明星公司旗下旷视研究院带70人团队的算法总监了。

这位旷视最年轻的总监,手下却尽是年龄比自己大的同事,范浩强想了想,才想起了一位实习生是年纪比自己小的。

并且因为“保送即创业”,范浩强虽然从没给自己写过求职简历,却经常需要看别人的简历,面试候选人。

甚至有一次,他还不得不帮一位比自己年长十岁的候选人解答一下“人生遇到焦虑该怎么办”。

在对团队的态度上,范浩强自称“信仰流”leader,给组员以自信,“使你相信你能做到”,和组员一起走下去。

“Leader分几种,有的是Manager,就是管你的,有些就是跟你一起走的,我成长中遇到的基本都是后者,包括孙剑在内。”

在组员们看来,他们或许觉得范浩强名声在外,是心目中的偶像;或许觉得是身边的好友,会夜里睡不着觉跑来聊天;或许觉得是一起成长的伙伴,可以一起相互帮助走下去。

而对组员们,范浩强希望能“至少以小强为baseline(基线)”,具有一个人能把一个方向的事情做好的能力。

给范浩强以希望的,是旷视研究院强大的研发力量:数百人的团队,85%来自国内Top10高校,70个以上的奥赛金牌,前途不可限量。

实践派研究者

至于范浩强自己在技术上的“秘诀”,恐怕要用他一直在提的一句话来概括,那就是:

Engineering is magic

来源于马斯克的一条推特。

提及大一的landmark论文,范浩强总结的经验是:Engineering is magic。

“很多事情也没什么神奇的,就是你把所有环节都做对了,就做了一个别人之前没做到的事情。人脸识别发展至今有魔法么?没有任何魔法,现在翻出1990年的paper肯定能找出很多本质一样的东西出来,但就是在你做的过程中,各个环节里面都有一些应该做对的事情。”

手机图像降噪也一样。

“Engineering is magic,想出这些点并不难,关键是要真的一张一张去亲眼多看实验数据。”

而现在,范浩强对engineering有了更高的要求,更宏大的目标。

他说,目前自己的一块工作重心是实现算法生产的工业化体系,让数据、新算法、训练体系、测试、评估这几个部分高效有机的在一起运行,今天给需求,明天给模型,“这是我们的目标,这条路并不平坦,还在努力过程中。”

另外,则是要回答AI有什么用的终极问题,涉及业务方向、应用场景的选择,并进行商业化。

“在中国做商业化的AI其实是个崭新的命题,欧美很多做得很好的算法公司一做就能活20年,因为有着成熟完善的商业竞争环境和严格的知识产权制度,国内这方面就会差很多。要走中国特色商业化之路很难,但不妨碍我们把它做出来。现在我们做的工作是让商业化的环境变好,使得那些读完博再出来创业的同学有更好的环境。”

而engineering的能力,范浩强也希望能“迁移学习”到其他同学身上去,“旷视需要至少100个小强”。

而思考这些问题的,只是一位25岁的小哥哥,自带一种身为领袖人物的、与年龄不相符的责任感。

演脱口秀,吸别人的猫

除了工作的时候是个大神,范浩强的另一个人设则是段子手,自称“脱口秀演员里最会写代码的,码农里最会脱口秀的”。早年,旷视每一届年会范浩强都会上台表演脱口秀。

不过,常在河边走,总有会翻车的时候。有一年旷视人数暴增,台上的他愣是忘了词。

到了第二年年会,前来指导的专业演员看了之后,评价说:“看了你去年的录像,觉得很坚强。”

在专业演员的指导下,范浩强终于学会了如何镇得住过千人的大场面。

范浩强的另一个爱好则是猫。但因为害怕养死,他选择做一名“云吸猫”爱好者。

毕竟,范浩强自称“0~24点都可能在工作”,恐怕是没有时间铲屎的。

因此,他甚至连招聘都在想,可以优先招家里有猫的同学,这样可以方便的借机撸猫。

One More Thing

最后,范浩强给想要从事AI技术的年轻人一条忠告:

弄斧要去班门,做AI要去专业公司

他曾经作为面试官向候选人提问如何完成一类产品,候选人反复论证,认为产品无法完成,因为需要的样本量太大。

但这类产品在旷视已经商业化了。有赖于旷视Data++的功劳,数据的标注和管理都不是问题。

“这个数量的样本,直接去Data++提需求啊”范浩强说,“当你没有见过一个以非常高的效率做AI的团队和公司体系的样子的时候,你是想象不到你能做到什么的。”

对于旷视而言,整个旷视研究院有多个像范浩强团队这样的研发大组,有众多集天分与努力于一身的技术人才,正是AI界的“班门”,最当“弄斧”于此。

而这一点,在任何领域都是适用的。

AI社群 | 与优秀的人交流



AI内参 | 关注行业发展

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 ! 



登录查看更多
0

相关内容

图像降噪是图像处理中的专业术语。现实中的数字图像在数字化和传输过程中常受到成像设备与外部环境噪声干扰等影响,称为含噪图像或噪声图像。减少数字图像中噪声的过程称为图像降噪,有时候又称为图像去噪。
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
【纽约大学】最新《离散数学》笔记,451页pdf
专知会员服务
128+阅读 · 2020年5月26日
【课程推荐】 深度学习中的几何(Geometry of Deep Learning)
专知会员服务
57+阅读 · 2019年11月10日
高二进清华,大二开公司,29岁登上福布斯亚洲领袖人物榜
人工智能机器人联盟
5+阅读 · 2017年11月18日
高额融资「狂欢」背后的旷视科技
机器之能
4+阅读 · 2017年11月1日
人脸识别独角兽之战
数据玩家
6+阅读 · 2017年9月30日
自然语言推理新突破,地平线斩获三个世界第一
HorizonRobotics
6+阅读 · 2017年9月22日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Arxiv
5+阅读 · 2018年10月15日
Arxiv
6+阅读 · 2018年4月4日
VIP会员
相关资讯
Top
微信扫码咨询专知VIP会员