90后清华博士为AI“杀毒”,砌起安全墙

2022 年 7 月 18 日 THU数据派


  
  
    
来源:澎湃新闻

  本文为约8187字,建议阅读13分钟

本文介绍 了瑞莱智慧RealAI首席执行官、90后清华AI博士——田天。


成立3年,融资4轮,金额总计数亿元,专攻算法攻防、隐私计算、深伪检测,为AI“杀毒”。掌管着这家估值数十亿人民币AI初创企业的,是个典型理工科气质的 90后清华AI博士 ——田天

90后西安人田天从小痴迷计算机,凭借高中物理竞赛全国金奖保送清华计算机系,一路念到博士,2018年7月出了校门就加入浩浩荡荡的创业大军,做“真正的AI”。

他创办的北京瑞莱智慧科技有限公司要做第三代人工智能,为AI安全发展保驾护航。瑞莱智慧是RealAI的音译,由清华大学人工智能研究院官方发起设立,清华大学人工智能研究院院长张钹院士,和清华大学人工智能研究院基础理论研究中心主任朱军,共同担纲首席科学家。参与承担科技部、工信部、公安部、发改委等发起的多个国家级重大项目建设任务。

田天说,AI归根到底还是一项有用的技术,但算法、数据、应用层面的安全可控问题有待突破,不能简单停留在功能层面的复制或修修补补。 AI产业要真正做到顶天立地,得先立地,也就是加强基础层领域的技术研究,这就好比打好地基,是整个产业发展的最坚实基础

他擅长理性规划,制定目标和路径后逐步推进。但在创办这家企业前,他并不知道自己究竟是否适合创业。“但一旦开始做起来,很多问题就一定要去解决掉,包括公司的战略制定、管理、产品研发、销售推进。”田天说,自己的创业信心越来越足,对市场和第三代人工智能的判断越来越清晰。

瑞莱智慧RealAI首席执行官

人工智能瓶颈

1991年,田天出生于西安一个教师家庭。上小学时接触到计算机便萌生了兴趣,那时父母上课要用到电子课件,他觉得有意思,也开始自学PPT。从头建立一个网站、制作一个flash动画,对他来说是非常有成就感的事,甚至把自学经验总结出来发表,得到500多元稿费。


对计算机的兴趣越来越浓厚,他开始学编程,不断跟进计算机知识。2009年,18岁的田天凭借高中物理竞赛全国金奖保送进入清华大学计算机系,之后免试就读清华大学计算科学与技术专业,在这里,他完成了硕士和博士学业,主要研究方向是贝叶斯机器的理论、模型和应用领域。


田天说,自己真正接触到人工智能是在大二,从入门到现在已经有12年时间。那时候的人工智能还没有如此火热,直到2016年谷歌旗下围棋人工智能程序AlphaGo的出现。


它曾在和其他围棋程序的对抗中获得99.8%的胜率,在一项竞赛中以5:0战胜欧洲围棋冠军。2016年,AlphaGo约战围棋世界冠军韩国棋手李世石,以4:1的总比分取胜。


“整个行业得到了很大的促进,热度升温了很多。带来的直接变化就是更多的人进入到这个领域,很多人开始尝试它在不同方向的产业化。”深度学习在搜索技术、数据挖掘、机器翻译、自然语言处理等领域取得成果,“最开始大家觉得人工智能能力非常强,能够解决很多问题。


但从2018年开始,人们也发现了人工智能还有很大瓶颈,人工智能底层理论问题逐渐得到关注。


“我们发现人工智能到了一个产业化和应用的新阶段后,有一系列新的问题要去解决,主要是关于人工智能的算法、数据、应用等各方面非常棘手的问题,可以说是安全或者可靠性的隐患。


比如⼈脸解锁被破解、刷脸⽀付出现漏洞、⾃动驾驶汽⻋被⿊客操纵“误导”从而驶向其他方向,这些属于算法层面的安全漏洞。


“把AI用在游戏里,算法出错的影响也不会特别大,造成的损失是有限的。对话系统的智能问答出错,大家也就是笑一笑,觉得AI有点笨,也不会带来特别大的问题。


但人工智能在越来越多的关键领域落地,特别是金融、能源、医疗等高价值领域的应用与财产安全、人身安全甚至社会安全紧密相关,对人工智能的安全、可靠、可控要求越来越高,一旦出现不可控,带来的损失是巨大的。


而以深度学习为代表的第二代人工智能本身具有黑盒性和不可解释性,人们很难理解算法最终决策的细节和逻辑,这就导致了开发者、使用者都不可预知的攻击或误导。


再者,“一个隐私保护,一个知识产权,用户的人脸数据凭什么给一家公司用?”中国科学院院士张钹曾说,怎么用也是一个问题,“数据都被公司收走,是否会造成不公平竞争,这些都是需要思考和治理的。


主动上门的需求


传统AI技术局限凸显,第三代人工智能的理念出现了。早在2016年,张钹院士就曾提出发展“第三代人工智能”的理念 ,利用知识、数据、算法和算力4个要素,建立新的可解释和鲁棒的AI理论与方法,发展安全、可信、可靠和可扩展的AI技术

2018年,清华大学设立人工智能研究院,张钹院士担任新研究院院长,聘请图灵奖得主姚期智院士作为学术委员会主任。2019年,清华大学宣布成立人工智能研究院基础理论研究中心,以期建立第三代人工智能基础理论和方法体系,清华大学计算机系长聘教授朱军被聘为研究中心主任。

博士阶段,田天师从朱军,他所从事的也是与第三代人工智能相关的研究,包括机器学习算法与众包知识的整合,提高AI在有噪声的数据和标注情况下的训练和预测表现。2018年拿到博士学位后,田天没有去互联网大厂,而是把读研期间一直想做的事做了:办一家公司,把手里的技术落地。

“做这件事的想法和决心在读研期间是一直都有的。”田天说,当年瑞莱智慧最初的创始团队都是“清华同一个团队的”,“大家在一起配合了很长时间,非常有默契。”创业也是一拍即合,走出清华校门,寻找办公场地。公司成立后,他白天忙于业务和管理,晚上钻研技术路线和产品方向。

瑞莱智慧展示中心

“第三代人工智能能够应用的领域非常广,所以对于我们来说,反倒要去筛选,到底哪一块更需要我们的能力和产品,哪一块能让我们在市场产生相应优势。”落地场景的选择并非完全一帆风顺。

早期一些慕名而来的客户对田天团队提出AI需求,团队接到需求后研发再交付客户。但他们很快发现,这些主动上门的需求中,有时候客户搞不清楚现在AI到底能把问题解决到什么程度。有些需求听上去更像科幻,更多时候,客户所积累的数据并非是解决问题所需的数据,甚至没有数据。

最初,田天尝试过智慧旅游方案,通过AI为游客定制行程。这就要求人工智能有可解释性,智慧旅游不仅仅是给出一个旅游方案,更重要的是让客户信服,为什么是这个方案、它好在哪。

“当时期望高就高在我们想做出来的是一个真正可靠、可解释的系统。”需求本身没有问题,但很快被现实打败。当真正下手时发现,人工服务积累下来的旅游数据距离AI可用还有很大距离。从游客的角度,“他的需求到底在什么地方、他为什么提出这个需求等等,并没有得到很好的记录。”

在数据不足情况下,模型输出效果并不理想。要么继续积累更多数据,要么通过前期研发把算法做到能实现智慧旅游的程度,但后者又需要高额投入,而客户的预期是用相对合理的成本实现能力强大的AI。经过一段时间尝试后,他们觉得这样的项目现阶段并不合适公司的技术方向。
为AI“杀毒

从科研走向创业,这帮青年创业者越来越关注技术如何变成当下市场需要的产品,再把产品卖出去。

他们泡在市场里,挖掘身边认识的所有人脉资源,与这些潜在客户的交流让他们摸索出一些高价值的场景,找到最适合现阶段落地、快速产生应用价值的领域,这些场景的智能化升级能够获得合理的投入产出比。

在电网领域,AI图像识别系统可用于电网智能监控,判断高压线周围有无危险品。但如果为了恶意破坏基础设施,在危险品上加装花纹等特殊对抗样本,“AI图像识别算法就没有办法认出危险品了,那就有可能导致危险品出现又无法检测到,甚至一些地方起火了也检测不到,图像识别算法完全被消除。”

如果通过搭载的攻击算法对系统进行模拟攻击,然后评估系统表现,综合给出安全性评分,并指出安全漏洞在哪,用户再通过搭载的防御方案就可以针对性地加固提升。田天说,这套人工智能安全平台类似于杀毒软件,发现安全隐患的同时进行安全防御。

所有的AI都有相应输入,输入数据被黑客添加“ 对抗样本 ”,就会导致恶意攻击。“特别像针对人脸,有可能黑客会在人脸上加一些特定生成的干扰图案,就能误导后面的识别模型给出错误输出。”

这时候如果在输入数据后、识别模块前,先检测输入的数据是否存在恶意攻击,“如果有攻击行为,就拒绝请求,没有攻击行为再进入识别环节。”瑞莱智慧因此开发了AI安全防火墙。

田天说,这种AI防火墙和传统网络安全防护墙类似,不同的是防护对象是算法,它可以提供对抗样本攻击、深度伪造攻击等算法攻击的检测,除了应用在人脸识别领域,对目标检测、图像分类、自动驾驶系统也能防御部署。

另外,在金融风控场景中,一般情况下信贷分析模型所需的数据涉及消费、支付、社交、通讯等,高度绑定用户隐私,一旦在整合和使用过程被窃取泄漏,将造成严重后果。

田天说,结合人工智能、密码学、分布式系统等技术路线,瑞莱智慧正在搭建隐私保护计算平台,这一综合底层平台支持不同算法和场景,支持多方联合建模和统计。

“在金融领域我们做建模、风控等,虽然做的是金融模型,但这个模型底层都是基于隐私计算平台来搭建的。”相比传统不考虑隐私的建模方式,基于隐私计算平台的金融模型可以确保所有明文数据在原始的存储方不出库,保证密文计算效果。

根据场景选择技术,在这个90后的带领下,瑞莱智慧在政务、⾦融、能源、制造、互联⽹等领域落地,提供⼈脸识别系统安全、自动驾驶系统安全、深度合成和伪造检测、隐私保护计算、AI攻防靶场等产品和方案。

人工智能安全平台

在业务路径选择上,田天说,原本最早定位于“AI基础设施”,在市场里摸索后目标市场更细化了,他们把目光锁定在“更安全的AI基础设施+更智能的上层应用”。“在这些领域,目前相对来说能够提供类似能力的厂商比较稀缺。作为一家技术公司,我们在里面可以取得更高的话语权。”

用田天的话说,当初走了一些不大弯的弯路后,他们又“很快转回来了”。

不能简单停留在功能的复制或修补


90后硬科技创业者越来越多,学霸正在攻占创投圈。去年10⽉,瑞莱智慧A轮融资3亿元,去年11⽉获中⽹投近亿元战略投资。成立3年完成四轮融资,金额总计数亿元。

田天是个典型理工科特质的创业者,擅长理性规划,制定目标和路径后逐步推进。他觉得90后创业者是更敢想、更愿意突破的一群人。他们选择颠覆性的创业方向,特别是硬科技创业需要把握核心技术不断迭代,保持技术前沿性。

但要经营好一家企业,基础的素质和能力是相通的,比如领导力、韧性、学习力等。田天说,在创办这家企业前,他并不知道自己究竟是否适合创业,很多事情也不了解,大到销售商务、财务法务工作本就在学校时接触不多,小到办公室选址、装修也需要花时间思考。

“但一旦开始做起来,很多问题就一定要去解决掉,包括公司的战略制定、管理、产品研发、销售推进。这些问题都要想办法解决,所以就得不停学习不停提升。”

从当初六七个人的小团队发展到如今规模200余人,核心成员均来自清华大学、北京大学、中科院等。他带领的团队参与承担了科技部、工信部、公安部、发改委等部委发起的多个 国家级重大项目建设任务 ,包括科技创新2030-新一代人工智能重大项目中“安全大脑新一代人工智能创新开放平台”的建设、工信部揭榜项目新一代人工智能产业创新重点任务、人工智能关键技术源头创新专项等。

今年2月,瑞莱智慧入选第二批北京市专精特新“小巨人”认定企业。田天说,自己的创业信心越来越足,对市场和第三代人工智能的判断越来越清晰。第三代人工智能未来的发展,最核心的还是人才。

他认为国内AI产业偏应用,基于成熟的算法做微调,提供解决方案。“但第三代人工智能是理论上的突破,需要很多人研究AI底层,国内相关领域人才没有那么多。”这是将第三代人工智能推向舞台中央的一个大挑战。

“人才永远都是难招的。”光靠创始团队远远不够,他所困扰的也是如何吸引更优秀的人加入团队。“我们想要做的第三代人工智能是一件很宏大的事,需要长时间,需要一帮人持续投入资源去做。”

“除了我们自己推进它的研究和产业化之外,也要进一步营造生态和氛围,让更多人关注到人工智能底层的一些研究,追求人工智能底层的突破。”

在商业化之前,田天团队里的研究⼈员已经坐了多年冷板凳。技术产业的发展趋势,前期会经历高峰期,紧接着会有低谷期,后期会进入一个平稳发展阶段。这几年,他的切身感受是人们对人工智能的态度越来越冷静、理性。

AI归根到底还是一项有用的技术,但人工智能仍有很多新的关键问题待突破,不能简单停留在功能层面的复制或修修补补,“够一够能够着的东西早就被别人够走了。”

“真正做到顶天立地,得先立地。”也就是加强基础层领域的技术研究,这就好比打好地基,这是整个产业发展的最坚实基础,然后再深入产业,理解产业场景的核心需求。
——END——

登录查看更多
0

相关内容

清华大学:2021元宇宙研究报告!
专知会员服务
232+阅读 · 2021年11月2日
人工智能AI中台白皮书(2021年),45页pdf
专知会员服务
284+阅读 · 2021年9月18日
面向健康的大数据与人工智能,103页ppt
专知会员服务
109+阅读 · 2020年12月29日
【哥伦比亚大学】金融大数据与人工智能,90页PPT
专知会员服务
60+阅读 · 2020年12月27日
剑桥大学2020《AI全景报告》出炉,177页ppt
专知会员服务
120+阅读 · 2020年10月4日
清华大学《人工智能》书籍教学课件开放下载
专知会员服务
139+阅读 · 2020年7月27日
知识图谱推理,50页ppt,Salesforce首席科学家Richard Socher
专知会员服务
108+阅读 · 2020年6月10日
报名丨 清华校友走进百度
THU数据派
0+阅读 · 2022年3月30日
一位女博士在人工智能领域创业的那五年
AI前线
0+阅读 · 2021年12月17日
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年9月12日
Arxiv
0+阅读 · 2022年9月8日
Arxiv
28+阅读 · 2021年9月18日
Multi-Domain Multi-Task Rehearsal for Lifelong Learning
Arxiv
12+阅读 · 2020年12月14日
VIP会员
相关VIP内容
清华大学:2021元宇宙研究报告!
专知会员服务
232+阅读 · 2021年11月2日
人工智能AI中台白皮书(2021年),45页pdf
专知会员服务
284+阅读 · 2021年9月18日
面向健康的大数据与人工智能,103页ppt
专知会员服务
109+阅读 · 2020年12月29日
【哥伦比亚大学】金融大数据与人工智能,90页PPT
专知会员服务
60+阅读 · 2020年12月27日
剑桥大学2020《AI全景报告》出炉,177页ppt
专知会员服务
120+阅读 · 2020年10月4日
清华大学《人工智能》书籍教学课件开放下载
专知会员服务
139+阅读 · 2020年7月27日
知识图谱推理,50页ppt,Salesforce首席科学家Richard Socher
专知会员服务
108+阅读 · 2020年6月10日
相关基金
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员