在公共安全领域,AI技术驱动的智能视频和图像处理,正逐渐成为不可或缺的技术。人脸识别作为首当其冲的应用,正在公安刑侦中正在产生深远的影响。作为人脸识别领域的领军企业,商汤科技所提供的人脸布控、视图情报研判系统,目前已在北京、深圳、上海、四川和重庆等地落地应用,取得了多项成果,大幅提高了刑侦人员的执行效率。
人脸识别发展和深度学习带来的突破
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。由于不需要用户主动配合,它也是当前应用最为广泛的生物识别技术。以前的人脸识别程序,通常是基于很少的样本去预测、假设,结合人的先验知识,进行程序的编写,比如判断人脸的纹理、两眼间距离等;这种方式,对用于识别和比对的人脸图像质量要求较高,整体应用中的准确率不高,不足以应对现实中的各类复杂情况。因此,在2013年之前,人脸识别的落地应用,一直相对较少。
自2012年以来,伴随着深度学习的突破,人脸识别作为计算机视觉领域中的重要应用方向,也获得了突飞猛进的进展。商汤科技创始团队在2011年开始聚焦于深度学习,并率先将深度学习应用于人脸识别、人脸关键点检测、物体识别、人群分析、图像增强等领域。2014年,商汤科技创始团队成员在国际权威人脸数据库LFW取得人脸识别准确率首次超越人眼的成绩,达到了大规模工业应用的红线,对人脸识别的发展具有突破性的意义。
如果说以前的人脸识别属于人工指导的智能,那么深度学习属于数据指导的智能。具体来说,深度学习是指通过DNN(深度神经网络),对物体进行逐层的特征分类。例如,典型的深度学习人脸识别系统中,第一层可能会寻找简单的边线,第二层可能会寻找可以形成长方形或圆形等简单形状的边线集合,第三层可能会识别眼睛和鼻子等特征,最终将这些特征结合在一起,让机器可以根据训练数据集,达到拥有自我学习的能力,最终掌握“人脸”的概念。
因此,深度学习神经网络的层数越多,它能表达的信息也就越复杂,学习能力也就越强。因此,只要给予的训练数据足够多,最终的效果也就会越精确。目前商汤科技已经实现了超过1000层的神经网络架构,居于行业领先水平,并已应用在其人脸布控产品当中。
人脸识别在实际应用中的挑战
相比人脸识别的基准测试环境,实际应用环境的情况要复杂得多,这大部分来源于外部因素带来的影响,从而对最终效果带来极大挑战。这些外部因素,包括光线明暗、逆光、侧脸等角度变化、距离、天气干扰、因移动而产生的拖尾模糊,表情变化,以及当前前端(如摄像头)及存储设备清晰度的影响等。同时也包括目标人员的发型、胖瘦、年纪等变化;戴帽子、戴眼镜、假发、围巾等遮挡等。
在图侦领域,衡量人脸技术的应用效果有两项重要指标:抓拍率和比对识别率。前者即人脸的检测和跟踪,后者为人脸的比对和识别。通常来说,抓拍率对前端的要求相对不高,目前业内的主流系统都可以做到99%以上的抓拍率,而比对识别率受到外部的影响则会比较明显,就需要借助算法模型,来提高比对识别率。在考虑上述外部因素情况下,目前商汤科技的人脸技术,在两眼间像素30个像素点下即可实现抓拍,40个像素点即可以做到比对,包括范围在40%以内的人脸遮挡情况,整体性能表现在行业中处于领先地位。
事实上,通过算法模型提升识别率的关键,主要来自三个方面:硬件性能、数据资源,以及算法的先进性。在硬件方面,商汤科技拥有自行搭建的深度学习超算平台,可大幅提高算法迭代的周期和效率。在数据资源方面,商汤科技的人脸数据库,已基本覆盖了东亚国家的各种人脸类型。在算法的先进性上,基于商汤科技原创的深度学习框架,可支持超大网络模型的训练,并且可以实现成百上千倍的网络压缩,实现更快、更节能的网络。
图侦领域的人脸识别应用
人脸识别正在迅速替代传统的图侦方法:传统方法存在的问题,主要在于人海战术成本高。从行业调研来看,很多市公安局,专门从事人脸图像搜索的图侦人员,就超过400人,人力物力投入巨大,效率不高,无法满足刑侦部门的及时要求。同时,传统的智能分析算法局限性明显,主要体现在图像特征提取能力低,尤其对于模糊图像、暗光、噪声、多角度、遮挡等适应性差等问题上。
针对图侦的人脸识别应用,一般分为两种场景。其一是在事发后,从监控录像中采集人脸的截图,然后和目标库(如犯罪分子库)做静态比对,缩小目标范围到几人、十几人内,提高身份确认的效率。另一种,则是需要直接监控视频中做动态比对,实时检测、跟踪、识别人脸,并做出实时预警,同时也会用于事后的布控场景。结合在技术方面的优势和积累,商汤科技针对上述两种典型的应用类型,推出了“SenseTotem视图情报研判系统”,以及“SenseFace人脸布控实战平台”。
人脸识别在图侦领域的应用:静态对比
商汤科技SenseTotem视图情报研判系统,是一套采用基于深度学习的以图搜图系统,可通过采集监控录像中的人脸截图,比对搜索目标库中标准人脸照片,帮助图侦干警快速确认涉案嫌疑人员的身份。
SenseTotem视图情报研判系统
移动端人脸比对识别结果
SenseTotem视图情报研判系统最大的优势在于模糊图像识别能力强,可适应低分辨率、暗光、侧脸、低头、低像素的人脸截图,以及图像中人脸的发型、胖瘦、年纪、表情变化、以及眼镜、围巾遮挡等,SenseTotem视图情报研判系统支持千万级目标库中300ms内获得识别比对结果,支持1:N与N:N验证,其1:1人脸验证的图片相似度验证准确率在99%以上,1:N人脸搜索,返回TOP5相似结果的准确度超过98.5%,返回TOPl0相似结果的准确度超过99.6%。在该系统于某地的实际应用测试中,采用5.4万目标库,包含一线部门所提交的真实案发现场视频监控录像人脸截图,属原系统无法实现身份确认的模糊度很高的图片,人员年龄跨度10-30年左右证件照片。最终,通过约40天的测试(只由一名民警执行测试应用工作),共辨认出69名涉案嫌疑人身份。相比之前人工肉眼辨识1名民警最高一年30余人的确认数量提高200余倍。实现了很多模糊图像从原来的不可用到可用的质的突破。
SenseTotem视图情报研判系统
web端人脸检索界面
人脸识别在图侦领域的应用:动态对比
商汤科技SenseFace人脸布控实战平台,基于全流水线的深度学习算法,在千路级监控视频中实时检测、跟踪、识别人脸,并支持在数十亿级人脸抓拍库中进行轨迹还原、案件碰撞等实战应用,实现事前、事中和事后的人脸布控和信息挖掘,为刑侦、治安等业务干警提供高科技的有效办案工具。
相比较传统的人脸监控,SenseFace人脸布控实战平台对多角度、多光照、人脸部分遮挡等条件具有抗干扰性。基于GPU,SenseFace人脸布控实战平台可在千万级人员库中300ms内获得比对结果,命中率高,并且支持按时间、地点、目标库和属性特征等灵活设置布控任务。该分布式系统架构支持1000+路监控视频实时人脸识别。
SenseFace人脸布控实战平台适合用于如火车站、汽车站出入口、闸机口、电梯口等流动方向一致的固定通道的场景。当前该系统已帮助各地抓获了上百名犯罪分子,且对于抓获有作案前科惯犯帮助很大,目前多应用于公安事前、事中、事后敏感人员布控、失踪人员查找等。
人脸识别的未来
如今,基于深度学习的方法已经成为人脸识别技术领域的重要发展趋势和方向,这也带动了人脸识别技术在更多场景中的应用。而随着技术变革和应用的普及,建设大规模、分布式人脸数据库及识别系统的成本不断降低,识别的精度不断提高。也因此,人脸识别也逐渐应用在对安全性较高的领域。以商汤科技为例,目前商汤科技的人脸识别技术,除安防领域外,也已经广泛应用于金融、门禁、交通枢纽等领域。
例如,商汤科技的人脸识别技术,已经为超过3亿中国移动用户识别人脸认证身份。商汤科技还与拉卡拉展开合作,打造远程身份认证系统,与京东合作,为京东钱包提供刷脸登陆的便捷方式,应用于金融行业的人脸识别技术,作为传统人工认证方式的强力补充,提高用户体验的同时,降低人力成本。商汤科技同时也为各种线下会议,提供自助刷脸签到的服务,为众多社区,提供刷脸门禁。此外,当前不少火车站所采用的“刷脸”自主验证验票系统,也同样来自于商汤科技的人脸识别技术。另一方面,人脸识别技术在达到更高精度后,可以用于更多的定制化服务场景,带来服务升级。例如,它可以用于银行、餐厅等线下服务行业,针对前来的顾客进行身份识别,当遇到VIP客户时,便可自动激活后续的定制化服务机制,如此一来,VIP客户将不需要主动出示VIP会员卡,大大增强了用户的体验。
未来的人脸识别技术,将基于准确率的不断提升,提升各个应用领域的运作效率,带来安全性、效率、易用性等各方面的升级,改变我们生活和工作环境的方方面面。