这位清华副教授“半路出家”转战人脸识别,只因“爱得深沉”

2018 年 8 月 26 日 德先生

本文来源:《千人》杂志

人脸识别技术发展迅猛,热潮背后,人脸识别技术依然存在技术瓶颈,应用之路也并非一帆风顺。故本期《千人》杂志对话国家“青年千人计划”专家鲁继文博士,聆听他在人脸识别研究中不断突破瓶颈、推动其应用的故事。




“半路出家”转战人脸识别,只因“爱得深沉”

——专访清华大学自动化系副教授鲁继文


文/本刊记者 陈佳


在科技发展日新月异的今天,“刷脸“一词对于我们来说并不陌生,甚至,它已经“无孔不入”,渗透到了我们的生活的各个角落。支付宝将人脸作为个人的身份ID,实现扫脸登陆;某些品牌的相机拍照时,能实时将人脸标注出来;网上不时报道的某某高校“刷脸签到”……当然,“刷脸”技术还有更为“高大上”的应用,在2016年的G20杭州峰会上,安保人员通过在公共场所、关键通道布置高清摄像头,“刷”取人员面部数据,有力地促进会议安全的预警工作。而以上种种“刷脸”技术有一个专业的术语——人脸识别


2015年,人脸识别技术获得重大突破,同时迎来了大规模商用的市场爆发。有业界专家估计,“未来五年之内,国内人脸识别的市场规模可能将达到1000亿元。”人脸识别技术发展迅猛,成为人工智能大潮席卷当下之际,不可忽视的一种生物技术。然而热潮背后,人脸识别技术依然存在技术瓶颈,应用之路也并非一帆风顺。故本期《千人》杂志对话国家“青年千人计划”专家、清华大学自动化系副教授鲁继文博士,聆听他在人脸识别研究中不断突破瓶颈、推动其应用的故事。


后来者居上


人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到学术界广泛关注并获得持续进步,在90年代后期的美国最先开始进入初级应用阶段,于新世纪初发展至我国。人脸识别技术在我国发展时间并不长,但是被称为“人脸识别技术之父”的清华大学苏光大教授表示:“该技术在我国经过多年的发展,目前达到国际先进水平。”


毋庸讳言,在人脸识别的研究上,我国属于后来者,而作为后来者,如今能在技术研究和应用上跻身世界前列,鲁继文博士认为得益于以下三个因素:


首先是政府和企业界高度重视,给予了大量的资金支持;


其次是人才队伍强大,相关公司和科研院所大量从事该方向的研发人员为技术突破提供了智力保证,其中清华大学、中科院自动化所、中科院计算所在人脸识别技术上的研究已达国际先进水平;


最后,得益于政府的政策导向,为创新创业制订出一系列良好政策。国家“十一五”科技发展规划将人脸识别技术的研究与发展列入其中,明确指出“要在生物特征识别技术领域缩小与世界先进水平的差距,开展生物特征识别应用技术研究”。在这样的环境下,一批从事人脸识别的高新技术公司如雨后春笋般相继成立,对人脸识别技术的发展也起到了很大的推动作用。


在人脸识别的研究上,鲁继文博士个人也属于“后来者”这一角色。同样的,他也在实现着后来者居上的超越。他的本科专业是机械设计制造及其自动化,后来“半路出家”转而研究人脸识别。对于这一改变,鲁继文博士解释为兴趣二字,他称因为对本科专业兴趣寥寥,所以在研究生阶段果断选择了信号与信息处理专业,开始从事人脸识别的研究。


“半路出家”的鲁继文博士遭遇的最大拦路虎便是“相关专业知识不足”。当问及如何克服这一困难时,他显得轻描淡写:“为了能尽快熟悉掌握这个领域,我阅读了大量的论文和教材。”寥寥数语背后显示出这个年轻科学家的从容。


真的勇士敢于直面挑战


人脸识别技术经过几十年的发展,在控制条件和配合条件下,其识别精度已经得到很大程度的提高。但有人认为“它仍是模式识别和计算机视觉等领域最困难的问题之一”和“在应用上,依旧任重道远”。鲁继文博士对此表示赞同,他指出人脸识别技术的挑战是在实际应用中,很多时候是无约束条件下的人脸识别,此时人脸图像或者视频受姿态、光照、表情等因素的影响,在不同的时候采集到的同一个人的人脸图像往往呈现较大的差异。


然而,真正的勇士总是敢于直面困难,并且不断挑战困难。鲁继文博士在突破人脸识别技术瓶颈的道路上坚持多年,为了提高人脸识别技术在无约束条件下的辨识精度,他通过利用训练样本学习出一个判别力更强的度量空间,进而有效度量人脸之间的相似度。他先后提出了代价敏感度量学习、多流形判别度量学习、邻域排斥度量学习、稀疏重构度量学习、局部多核度量学习和深度度量学习等方法。除了在人脸识别中验证了它们的有效性之外,他还和合作者一道将其应用到步态识别、行人再识别、年龄估计、物体识别、目标跟踪、图像匹配、图像检索和跨模态识别等多个计算机视觉的应用中,均取得了较好的效果。


鲁继文博士目前正在扩展自己的研究方向,其未来研究应用的主要落地应用是智能视频监控。鲁继文博士介绍道:“目前国内外对智能视频监控的需求非常大,智能视频监控涉及到很多计算机视觉技术,包括人脸识别、物体识别、目标跟踪、物体检索、行为分析等。”


回国之后,除了研究人脸识别之外,鲁继文博士主要面向视觉大数据的哈希学习和深度学习两个方向开展相关工作,通过机器学习的办法,更好的实现对视觉大数据的特征表示。


人工智能是否已超过人类?


2016年3月,阿尔法狗战胜世界围棋冠军棋手李世乭带给我们的震撼余波还未平息,今年1月,Master战胜聂卫平,挑落众多顶级棋手取得54连胜的消息又掀起一波关于人工智能讨论的高潮。


鲁继文博士认为,相对于下围棋,人脸识别的环境更开放,挑战性也更大。而在这一难度更大的项目上,“世界记忆大师”也惜败于百度的机器人小度。我们不禁产生这样的疑问:人工智能已经超越人类了吗?对此,鲁继文博士显得十分理性:“我们还是要辩证地看待小度战胜记忆大师这件事,一方面,我们对以人脸识别为代表的人工智能技术取得巨大突破感到振奋;另一方面,此次比拼的内容是跨年龄人脸识别,在这个任务上,人类的能力其实并不是很强大。”


鲁继文博士继而提到他以前做过的一个基于人脸图像的血缘关系识别项目,即通过机器学习自动判断一对人脸图像有无血缘关系。鲁继文博士指出:“当时我们开发的算法能做到75%左右的正确率,这个水平其实也比人类识别血缘关系的能力略强,但是仍然不能说机器的智能就超过了人类,我们必须看到机器智能超过人类智能还有很长的路要走。”


在人脸识别和围棋对弈活动上,人工智能都有赶超人类之势,人工智能威胁论似乎正在变成现实,人工智能与人类应该保持一种什么关系也一直是大众广为关注的一个话题。鲁继文博士表示:“人工智能发展到今天,确实取得了长足的进步,尤其是这几年在很多领域,我们都能感受到人工智能给我们生活带来的便捷。虽然说目前也存在人工智能威胁论,但是我个人还是倾向于认为人工智能将全面改变人类的生活和工作方式,必将改写人类的很多历史。”


“不管上帝是否发笑,我总是爱思考”


2015年鲁继文博士入选国家第十一批“青年千人计划”,全职加入清华大学自动化系任教,实现由“研究者”到“研究者兼老师”这一角色的转变。在这个转变过程中,鲁继文博士最大的感受是“需要考虑的东西更多了”。他说道:“以前对一个课题只需要考虑自己是不是可以做出来,现在需要考虑学生去做会遇到什么问题,为什么这些问题可能会对他们有挑战。”


生活中的鲁继文博士喜欢分析热点的时事政治新闻,正是这个需要分析思考的兴趣为他更好地组织科研团队提供了不少启发和借鉴。鲁继文博士在成为一名教师之后,对于指导学生也颇有心得:“在不同的阶段对学生的指导方式需要做不同的调整。具体而言就是在学生刚刚进入科研角色、对科研还没有形成整体宏观认识的时候,花大量的时间手把手的教他们熟悉科研的基本流程,等到学生基本熟悉流程之后,再注重培养他们独立的科研能力。”鲁继文博士在国内和国外都合作指导过一些博士生,他们与鲁继文博士在一起工作一段时间之后,每个人都在领域顶级会议和重要期刊等发表了第一作者的论文。


回国之后,鲁继文博士和众多青年人才一样,面临科研经费不够灵活和生活待遇偏低两重困境。他坦言:“科研经费使用不够灵活,一定程度上影响了科研的进展。生活上则主要还是待遇问题。青年科研人员工作任务重,压力很大,但是收入其实还是偏低,面对高昂的生活成本,有时候很无奈。”


鲁继文博士希望我国在科研管理上实现更进一步的突破。他表示,在科学的科研管理体系下,包括自己在内的科研工作者有信心做出媲美国际先进水平的科研成果。




推荐阅读


登录查看更多
9

相关内容

鲁继文,清华大学自动化系副教授、博士生导师,主要研究领域为计算机视觉、机器学习和智能机器人。近年来在IEEE汇刊上发表论文60余篇(其中PAMI论文13篇),CVPR/ICCV/ECCV会议上发表论文50余篇,论文被引用7400余次。主持国家自然科学基金联合重点基金、国家优秀青年科学基金、国家重点研发计划课题等科研项目10余项。担任国际期刊Pattern Recognition Letters主编,IEEE T-IP、T-CSVT、T-BIOM和PR编委,国际会议AVSS 2020和DICTA 2019程序委员会主席,中国计算机学会计算机视觉专委会常务委员、中国图象图形学学会视觉大数据专委会常委委员。
【浙江大学】人脸反欺诈活体检测综述
专知会员服务
31+阅读 · 2020年4月15日
中科大-人工智能方向专业课程2020《脑与认知科学导论》
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
清华大学发布:人脸识别最全知识图谱
全球创新论坛
10+阅读 · 2018年11月21日
清华出品 | 人脸识别最全知识图谱
THU数据派
17+阅读 · 2018年11月8日
人脸识别最全知识图谱—清华大学出品
人工智能学家
10+阅读 · 2018年10月28日
半路转型做人工智能,谁说不可行?
AI前线
3+阅读 · 2018年2月28日
高二进清华,大二开公司,29岁登上福布斯亚洲领袖人物榜
人工智能机器人联盟
5+阅读 · 2017年11月18日
人脸识别独角兽之战
数据玩家
6+阅读 · 2017年9月30日
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
Logic Rules Powered Knowledge Graph Embedding
Arxiv
7+阅读 · 2019年3月9日
Arxiv
6+阅读 · 2018年10月3日
Structure Aware SLAM using Quadrics and Planes
Arxiv
4+阅读 · 2018年8月13日
Few Shot Learning with Simplex
Arxiv
5+阅读 · 2018年7月27日
Arxiv
4+阅读 · 2018年7月4日
Arxiv
3+阅读 · 2018年2月12日
Arxiv
4+阅读 · 2017年11月4日
VIP会员
相关资讯
清华大学发布:人脸识别最全知识图谱
全球创新论坛
10+阅读 · 2018年11月21日
清华出品 | 人脸识别最全知识图谱
THU数据派
17+阅读 · 2018年11月8日
人脸识别最全知识图谱—清华大学出品
人工智能学家
10+阅读 · 2018年10月28日
半路转型做人工智能,谁说不可行?
AI前线
3+阅读 · 2018年2月28日
高二进清华,大二开公司,29岁登上福布斯亚洲领袖人物榜
人工智能机器人联盟
5+阅读 · 2017年11月18日
人脸识别独角兽之战
数据玩家
6+阅读 · 2017年9月30日
相关论文
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
Logic Rules Powered Knowledge Graph Embedding
Arxiv
7+阅读 · 2019年3月9日
Arxiv
6+阅读 · 2018年10月3日
Structure Aware SLAM using Quadrics and Planes
Arxiv
4+阅读 · 2018年8月13日
Few Shot Learning with Simplex
Arxiv
5+阅读 · 2018年7月27日
Arxiv
4+阅读 · 2018年7月4日
Arxiv
3+阅读 · 2018年2月12日
Arxiv
4+阅读 · 2017年11月4日
Top
微信扫码咨询专知VIP会员