随着城市化进程的不断加快,各个城市无一例外地面临平安城市建设的问题,也就是在规划城市建设的同时,建设城市视频监控系统,使城市的主要干道、城市重点部位、案件高发区域处于摄像头的24小时监控之下。
近年来,公安机关在以刑侦部门为主导的打击刑事犯罪的斗争中,开创了多警种、多信息合成作战的模式,运用各类信息服务于侦查破案。对于一个视频监控设施建设完善的城市,视频的信息应用于侦查破案的作用越来越大。视频侦查(或称图像侦查) 成为与刑侦、技侦、网侦并驾齐驱的新的侦查破案手段。
随着城市化进程的不断加快,各个城市无一例外地面临平安城市建设的问题,也就是在规划城市建设的同时,建设城市视频监控系统,使城市的主要干道、城市重点部位、案件高发区域处于摄像头的24小时监控之下。
近年来,公安机关在以刑侦部门为主导的打击刑事犯罪的斗争中,开创了多警种、多信息合成作战的模式,运用各类信息服务于侦查破案。对于一个视频监控设施建设完善的城市,视频的信息应用于侦查破案的作用越来越大。视频侦查(或称图像侦查) 成为与刑侦、技侦、网侦并驾齐驱的新的侦查破案手段。
模糊人像复原技术
在当前刑事侦查公安工作中,人脸图像作为最直观的线索,在各类案件中起到了非常重要的作用。无论是何种案件总会涉及犯罪嫌疑人。而嫌疑人的人脸图像,相比其他特征如指纹、DNA、脚印、虹膜等更直观,也更容易让普通人简单辨别,因此人脸图像也是案件中应用最广泛的线索和证据。人脸图像通常用于嫌疑犯通缉、排查和辨认等过程。
随着技术的进步,数码照相、摄像和监控设备的普及,犯罪嫌疑人在案件中留下影像的机会越来越多,获得嫌疑人照片的机会也越来越大。例如,在新疆“7.5 事件" 中,监控系统获得了上千幅嫌疑人的图像,为案件的侦查提供了巨大的帮助和支持。在韶关“6.4 事件" 中,一些目击者用手机拍摄的图像也提供了有价值的线索。在很多地方尤其是经济发达地区和城市地区,嫌疑犯留下影像的机会比留下其他痕迹的机会更大。
如何有效地在刑事侦查中应用人脸图像信息,准确地提供侦查方向是新时期面临的重要课题。
在实际视频侦查中,模糊人像出现在各个不同的应用场景,构成了不同的应用模式。
1) 一般监控
如图1 中的监控照片,是由街道边的监控拍摄而成的。一般道路上的监控,可以监控到大量的人像,由于压缩以及监控安装角度等因素,人像具备距离远、姿态多样、分辨率低等特点。
图1 一般监控
2) 汽车车站
监控摄像头从其位置和用途上可分为监控模式和卡口模式。在侦查中,经常需要对可能出现嫌疑目标的视频片段进行查看,以确认嫌疑目标是否出现或是经过。对于此类情况,经常需要人工查看许多案件视频,以确认目标嫌疑特征。一般有两类情况,一类是视频目标非常模糊,需要进行人像清晰化处理,以进行目标确认。另一类是人像比较清晰,如售票窗口视频数据。在一些案件中,经常希望能够进行人像的快速筛查,缩小排查视频范围,而不是人工的逐一查看。图2 为车站监控。
图2 车站监控
3) 地铁车站
地铁环境中,摄像头架设的位置与汽车站环境的卡口模式相似。其特点是人员集中性强,在通关区域,视频质量一般较好。
地铁中相关案件的特点在于,由于人员流动性非常强,导致人员的排查比较困难。比如受害人受到侵犯后,案犯迅速流窜。同时,由于人员密集程度高,经常在视频中看到受害人周围有一群人,难以确定真正的案犯。但是在地铁类案件中,如果嫌犯是专门在地铁中流窜作案,经常是在特定时间,出现在地铁网络中的不同地方,即在视频网络中有频繁出现的特点。如果能够利用相关视频中人像进行地铁网络中嫌疑人员的快速筛查,将对很多案件进展带来很大的推动作用。
4) 出租车
现在出租车内也普遍安装了监控摄像头(图3),并且能实时传输至公交治安部门和客运管理部门的控制中心。这样对犯罪嫌疑人的实时跟踪和抓捕提供了很大的便利。同时,一般情况下出租车内的照片质量很高(不低于640×480)。
在很多案件中,应侦查需求,经常需要确定相关嫌疑犯的乘车情况。在实际工作中,此类图像涉及的范围较多。而一个城市的出租车经常有上万辆,每天有大量的回传数据,依赖于人工手段来排查嫌疑犯乘车情况的视频数据,往往非常困难,如果针对此类情况,依据人像进行高效的筛选,可以提高案件侦破的效率。
图3 出租车监控
5) ATM 机
在ATM 机环境下(图4),人像质量一般比较高,其质量在视频侦查所面对的视频资料中,应算作是质量最高的。随着犯罪人员反侦察意识的提升,在ATM机取款时会有意掩饰和遮挡。如何有效地去除相关遮挡,消除此类干扰因素带来的影响,是目前这类案件所面临的迫切问题。在去除干扰的基础上,如何进行满足侦查需要的嫌疑目标的快速筛查,成为该环境下人像应用的迫切需求。
图4 ATM机
6) 老照片
图5 是一些老照片,或是由各种拍摄手段(手机,网络摄像头) 拍摄到的人像,分辨率较低,表情各异。由于以前的各种成像原因,在进行实际办案和照片使用时,需要进行图片清晰化复原处理。
通常情况下,办案人员会利用人脸图像进行排查、走访、辨认和发布通缉。这些过程都依赖于普通人对人脸图像的辨认程度。如果范围越小、图像越清晰,那么得到线索的机会也越大。
图5 老照片
所谓低分辨率人脸重建(图6),是指“从一幅或多幅低分辨率的输入图像中,通过计算方式获取高分辨率人像"。
针对低分辨率图像的超分辨率方法本质上是一个反问题,由于条件数远小于求解数,因此也是一个严重的病态问题。对于低质量人脸图像来说,是一类特殊的超分辨率问题。
在科学研究领域,对于低质量人脸图像处理技术,最早源于1999 年和2000年Baker 的开创性工作。在其主要的两篇文献中讨论了通用超分辨率技术的局限性和通过样本库突破局限的尝试。其后有Ce Liu、Bahadir 等利用PCA 分析工具基于样本库提出不同的方法。这些方法都是利用样本库进行约束。2006 年公安部物证鉴定中心的技术人员针对国内人群样本库进行了相关研究得到了较好的试验结果,2007 年中国科学院自动化研究所的研究人员根据基于流形学习的样本库选择方法做了进一步研究,对重建结果做了进一步改善。
图6 人脸低分辨率重建
由于成像条件的原因,各种来源的大部分人脸图像都面临分辨率低、角度不正等问题。在通常的监控系统中,一部分是广角镜头,另一部分为了得到大的监控范围而安装位置较高,这些情况下都会得到较小的目标图像,还有一种情况是许多有反侦查能力的犯罪嫌疑人都会远离摄像头甚至躲避摄像头。根据实验证明,当人脸图像的分辨率低到12×16 像素以下时,就基本失去了辨认的价值,再考虑角度、噪声以及模糊因素的干扰,给普通人的面部辨识工作带来很大困难。
在这里,有几个关键注意事项。
1) 通过计算的方式
在一线实战中,当看到模糊的监控视频时,往往是由模拟画像技术人员进行画像,如图7 所示(参见杨武杰,《模拟画像》)。
可以看到,画像人员根据观察,利用画笔或是电脑,画出嫌疑人的正面像。这类画像本质上是利用了人脸的多姿态信息。在视频提供了足够姿态信息并且画像人员专业水平很高时,可以画出很高质量的人像,这类画像使用价值很高。此类工作对专业水平要求很高,在一线进行推广的难度较大,只能由少数专业人士掌握和有效使用。
图7 电脑模拟画像
本文所讲的重建,是利用计算机实现的重建,具备很多优点,比如:
(1) 对操作人员的画像专业要求较低,不需要特别专业的人像知识(如果具备画像基础会更好)。
(2) 操作较为简单,很多基础性工作(建库、分类、预处理) 等均由电脑完成,人工直接操作即可。
(3) 有一张或是多张视频截图作为输入,重建时是基于这些图像,因此易于达到较高的可信度。
(4) 可以根据视频中截图个数,生成多种姿态的人像。
(5) 生成过程简单、快捷,使得一线人员可以从容地完成人像挑帧,给出多个处理结果,直到满意为止。
2) 一幅或多幅图像输入
在人脸进行复原时,有时是一幅人脸照片的输入,有时是多幅人脸照片的输入,情况各自不同。
一般情况下,单幅人脸比较容易进行重建。从算法实现的角度来讲,仅考虑一个姿态的信息即可。比如对于图8 中的两幅图,分别可以按照单幅人脸进行处理,得到图9 的结果。
图8 视频截图的两个姿态
图9 单幅人脸重建
从以上结果可以看出,两个重建结果具备相似的地方,但是也存在差异性。此类结果导致一线干警进行使用时,可能会认为是两种不同的人脸。
理想情况下,从实战角度出发,希望能从多幅多姿态人脸,直接重建得到较为清晰的人脸。该人脸能考虑多种人脸姿态因素,因而复原得到的人像更接近实际人像。针对多幅图像而言,由于引入了多姿态信息,在算法实现时,需要对多姿态数据进行融合考虑,从算法角度来讲,难度系数很高。
3) 重建结果与原始图
图10 为低分辨人脸复原重建图,将复原人脸与真实人脸进行比较,会发现如下现象:
图10 低分辨人脸复原
(1) 真实人脸中的很多细节,在复原人脸中丢失了,比如真实人脸的双眼皮,在复原人脸中为单眼皮;真实人脸的鼻孔鼻毛,在复原人脸中没有了;
(2) 表情丢失:真实人脸是咧嘴的,在复原人脸中嘴巴闭上了;
(3) 两幅图的人脸轮廓,五官位置等非常相似。
以上现象可以认为是合理的,原因是,在视频监控中,输入图是一幅低分辨率图像,因此很多细节是丢失的。重建时,不可能将这些细节复原出来(即使重建出来,也会认为是不真实的)。所以,在实战中,轮廓、五官位置等整体信息,将成为此类结果应用的关键。
在2012 年,黑龙江省公安厅举办的“全省视频侦查培训班" 中,黑龙江省公安厅梁立斌在报告中认为:模糊人像的五官细节不清,但是保留了脸部轮廓以及形体结构的主要特征,信息量较大;同时认为,在一个人的原来脸型基础上,用于本人相似的形态特征五官组合,能保持部分相貌总体特征。
图11 为替换五官后的效果图,经过替换可以发现,虽然人的部件特征被替换,但是整体轮廓仍然很相似,一般还是可以辨识为原来的人像。因此可以判定,在此类应用中,整体轮廓占主要作用,此类重建方法完全可用于视频侦查活动。
图11 替换五官
参见图12,在利用图像进行人脸复原计算时,考虑因素为:
图12 单幅重建考虑因素
性别:男或女,性别不同人脸的特征不同,需要分开考虑。在允许情况下,可以考虑分性别进行属性细分。
脸型:如方形脸、圆脸、瓜子脸等,不同人脸的脸型在视频中表现不同,对重建的要求不同。
年龄:如18~28 岁,29~44 岁,45~59 岁等。不同年龄段的人脸,具备不同的特征,需要细化考虑。
关键点布局:如4 点法,6 点法等,关键点布局可以认为是一项约束,在模糊人像复原中,\关键点" 是一个很重要的输入项,体现了操作者对于人脸关键信息的认定,同时允许操作者对关键点进行调整,以便最终得到一个满意的结果。
人脸姿态:不同姿态有不同的考虑因素。人脸在不同姿态下表现差异很大,寻求合适的姿态,是一个非常关键的问题。
光线因素:如直射光、漫反射,涉及方向、光强等因素。由于人脸是一个立方体,人脸不同区域的光线差异较大,光线因素在实际中不得不考虑。
区域因素:即不同人种的信息,主要是考虑不同人种的差异性。由于以上因素对各人种均有涉及,所以是否允许系统选择不同人种,成为一个非常关键的要素。
《警用影像处理技术手册》
主编:胡晰远
责编:李欣
北京:科学出版社,2017.9
ISBN:978-7-03-054113-0
《警用影像处理技术手册》凝聚了作者多年来在视频和图像处理理论研究以及公安刑侦影像分析应用中所积累的理论方法和实践技术,通过本书的学习,将为读者在运用视频和图像处理知识,解决公安刑侦影像分析中遇到的问题提供理论基础和实践工具。主要内容包括:影像处理基础知识、刑侦影像的特点、处理原则与流程、影像目标(车牌、车型、人像等)分析技术、实用技术与国内外影像处理系统介绍、实战案例分析与处理流程、影像平台规范等。本书注重理论体系的完整性、系统性和实用性,通过理论分析与实际案例相结合,阐释算法模型背后的物理意义,强调影像处理理论在公安刑侦影像分析实战中的应用。
(本期责编:李文超)
一起阅读科学!
科学出版社│微信ID:sciencepress-cspm
专业品质 学术价值
原创好读 科学品味
点击“阅读原文”可购买本书