看点:对话深瞐科技CTO王建辉,看20年通信老手如何做车脸识别和视频结构化的排头兵。
很多人第一次看到深瞐(mò)科技,会误将其看成“深晶(jing)”。“瞐”这个字虽不常见,却有着特别的含义,取自“美丽深邃的眼睛”之义,三个“目”字组合又与被喻为“第三只眼”的安防领域相契合。
深瞐科技正如其名,早早扎根安防行业做算法,是国内最早提出车脸识别和专注于视频结构化算法的安防公司之一。
在中关村国际创新大厦,智东西与深瞐科技CTO王建辉进行了一场深度对话,看这家由北大学子创办的公司如何在安防行业早早抓住AI时代的浪潮,成为视频结构化领域的种子级选手。
▲深瞐科技CTO王建辉
深瞐科技的创始人兼CEO陈瑞军是1987级北京大学经管系学生,毕业后曾在大唐电信做过销售。2001年,他在北京创办专注于视频光通信领域的蛙视通信公司,用光通信经验解决数据传输问题,在安防行业积累了深厚的工作经验和行业理解。2011年,陈瑞军离开了蛙视通信。
后来,陈瑞军通过朋友认识了知名CV/ML学者美国加州大学圣地亚哥分校(UCSD)的屠卓文教授和华中科技大学电子与信息工程系教授白翔。在屠教授的建议下,他们于2012年成立了华富睿智公司,也就是如今的深瞐科技。
渐渐地,团队里的年轻人们开始“嫌弃”华富睿智这个名字有点土。到了2015年,深度学习开始席卷全世界,于是乎他们的团队想以“深”字为名,而作为一家以计算机视觉起家的公司,他们又希望取和眼睛相关的字眼,在“瞳”、“视”等字被很多其他公司使用后,“瞐”这个特别的字走进了他们的视线。
“瞐”字由三个“目”字组成,寓意美丽深邃的眼睛,又可代指“第三只眼”的安防领域。于是,在2015年,这家公司正式更名为“深瞐科技”。
王建辉的本科、硕士、博士均就读于华中科技大学,在博士期间主要研究的是算法的硬件加速。王建辉不仅和深瞐科技的首席科学家王兴刚是本科同学,而且在博士毕业前就认识了陈瑞军,并收到了陈瑞军的邀请。
2016年,毕业一年有余的王建辉加入深瞐科技担任CTO,负责总体的技术。
据王建辉介绍,深瞐科技曾在2017年获得考拉基金投资的数千万元A轮融资,在2015年底获得东方君盛数百万的天使轮投资。目前其团队有220人左右,其中研发人员约占总人数的二分之一,年轻人占了团队的绝大多数。
和多数一创立就踏入人脸识别领域的CV公司不同,深瞐科技最早将AI技术布局在车脸识别领域。
王建辉告诉智东西,之所以早期不做人脸识别,是因为从国家建设的角度来讲,当时所有摄像头建设的高度均不低于3.5m,这个高度的摄像头看不清楚人脸,并不适合做人脸识别。
现在一些摄像头的高度可降到2.5m,再加上摄像头发展越来越高清,可以清晰的摄入一些人脸数据来,所以深瞐后来才开始做人脸识别。
在陈瑞军等人的带领下,早期的深瞐科技使用的是传统计算机视觉算法,精度偏低。在2012年底,他们最早提出“车脸识别”的概念并完成产品开发,那时候,深度学习还主要活跃在学术界。
到了2014年,他们开始转做深度学习算法,成为第一批将“深度学习”技术应用于“车脸识别”的公司之一,并推出了一系列车脸识别产品,包括车辆特征识别算法SDK和车辆综合平台等。其车辆综合平台在桐乡、西安、新乡等多地落地应用,协助警方破获多起案件。
不过在安防领域,除了车辆之外,对人的检测、识别和分析也是一项重头戏。在车脸识别的基础上,陈瑞军等人从2015年开始带领团队做视频结构化算法。
视频结构化是解决安防体系整体智能化的重要途径,可以自动识别不同视角、不同光照下的车辆特征和人脸、人体特征,便于后期快速检索。
目前中国有1.76亿监控摄像头,每秒产生非结构化监控视频数据约66TB,基于深度学习的车辆、行人识别算法,比传统方法更加高效和准确。
据王建辉介绍,深瞐的视频结构化平台能分别识别20多种车的属性和20多种人的属性,其精度和效率均达到业界领先。
目前该平台能识别5500多种车头品牌型号和3500多种车尾品牌型号,基本上涵盖了目前中国路面上所有行驶的车辆。
除了识别车身特征和车牌外,该平台还能识别车辆更特征化的属性,比如说年检标、遮阳板、纸巾盒、天窗、备胎等各种车内外物体的属性。
针对驾驶人、乘客,该平台不仅可以提取性别、年龄、发型和胡须、衣服颜色及款式等特征,而且可以分析车内人物的行为,包括是否存在未系安全带、开车打电话等违法行为。
围绕着车辆识别和视频结构化,在实际业务需求的推动下,深瞐科技陆续推出了更为完整的产品布局,包括结构化网络摄像机、嵌入式视频分析器、智能存储和集中式分析服务器,从边缘到云全面发力。
如今安防领域做人、车、物整体解决方案的玩家越来越多,面对日趋激烈的竞争,王建辉认为,深瞐科技主要有两大优势:一个是其视频结构化算法的精度和效率在业界领先,另一个是因为早早入局而积累的许多客户和来自实际应用的庞大数据集。
从传统计算机视觉到转向用AI算法解决问题,陈瑞军带领的深瞐团队曾面临来自算力的挑战。在2014年到2015年期间,他们开始用深度学习解决问题。
那个时候, GPU服务器尚未普及,公安使用的云计算服务器的建设基本上都是CPU服务器,很少用到GPU。面对计算资源严重不足的问题,当时他们为此做了对算法很多优化,使之可以在CPU跑完计算任务。
随后算力的爆发为安防市场带来新的生机,他们继续保持自己的节奏,专注于算法精度和效率的提升。
由于视频结构化的运算量非常庞大,为了提高对视频数据进行实时处理的运算效率,在陈瑞军、王建辉等人的带领下,深瞐科技还曾在去年联合硬件生产厂商推出基于FPGA神经网络算法硬件加速芯片,目标是相较CPU功耗比提升4-8倍。因为市场表现不如预期,该芯片产品持续迭代到今年2月。
目前深瞐科技在边缘计算方面主要使用的神经网络加速器是华为海思HI3559A,服务器方面使用的芯片有比特大陆、英伟达、华为昇腾310等。
不过芯片业务并不是深瞐的主线,王建辉告诉智东西,深瞐的核心业务在于视频结构化算法,其核心竞争力在算法的精度和效率,在多家客户的测试,他们的视频结构化算法的表现都是行业第一。
例如今年8月初在无锡的一个视频结构化测试中,当算法的精度都很高的情况下,深瞐科技的算法效率可达到竞争对手的2到3倍。
长期的行业数据积累亦是提升竞争力的关键,王建辉表示,车辆相关识别在数据采集和标注过程均存在难点。
首先,通常人脸人体的相关数据经过一次标注后基本上就可以一直用,不需要做反复的更新。但与人脸、人体不同的是,每年都有400多种新的车型数据,因而车辆相关识别需要不断的去打磨算法和累积数据。
其次,很多人脸识别与环境比较搭配,可以请一些公司去商场等制定位置做数据采集工作,然而车辆数据并不好采集,获取路面上视频监控数据的唯一渠道只有公安。
此外,车辆相关识别的算法还需要很强的场景适应性,这个算法不仅在北京路面可以用,在其他城市的路面上也要能用。而收集的不同地区的数据越多,精度就会越高,再加上对算法最有用的是小概率事件,常规事件对算法精度提升相对来说有限,因此这些都要靠持续积累数据。
通过长期和客户的合作,深瞐科技既拿到更多来自应用场景的有效数据,又获得更多关于算法问题的反馈,从而促进算法的不断迭代和提升,建立起自己的竞争壁垒。王建辉说:“车辆领域足以匹敌的竞争对手越来越少。”
2019年注定是动荡的一年,在安防的赛道上,前有海康、大华等老牌玩家镇守,后有商汤、旷视等明星新秀杀入,甚至BAT、华为等科技巨头都开始涉足安防,AI+安防领域的竞争将进一步加剧,市场会面临洗牌。
在这没有硝烟的安防战场上,王建辉认为,越来越多的传统安防厂商需要和有深度学习能力的企业合作,联合打造一些解决方案,将来智能化会是这个行业的必然趋势。
本账号系网易新闻·网易号“各有态度”签约帐号
超级公开课NVIDIA专场再次开启!首次线上讲解NVIDIA新一代图灵架构GPU Tesla T4。主讲群仅限300名额,欢迎扫码报名!