近年来,人脸识别技术有了长足的进步,这主要是因为有了用于深度学习模型的大型且日益复杂的训练数据集。然而,这些数据集通常包括从新闻网站或社交媒体平台刮来的图像,因此,在更先进的安全、取证和军事应用中的效用有限。这些应用需要更低的分辨率、更远的距离和更高的视角。为了满足这些关键需求,我们收集并策划了一个大型多模态生物识别数据集的第一和第二子集,旨在用于在极具挑战性的条件下进行生物识别技术的研究和开发。到目前为止,该数据集包括超过350,000张静态图像和超过1,300小时的视频片段,涉及约1,000个对象。为了收集这些数据,我们使用了尼康单反相机、各种商业监控相机、专门的长焦研发相机,以及第一组和第二组无人机平台。其目的是支持开发能够在高达1000米的范围内和从高仰角准确识别人的算法。
这些进展将包括对人脸识别技术现状的改进,并将支持使用基于步态和人体测量的方法在全身识别领域的新研究。本文介绍了用于收集和整理数据集的方法,以及数据集在当前阶段的特点。
高度和范围的生物识别和鉴定(BRIAR)计划的构想是在具有挑战性的、不受控制的全动态视频条件下,推进面部、步态和全身(WB)生物识别领域的现有技术水平。这包括支持能力,如人员检测和跟踪、图像增强和大气湍流缓解。为了实现这些目标,BRIAR计划正在建立一个独一无二的数据集,以促进创建算法来解决这些具有挑战性的情况。BRIAR计划将分几个阶段实施,每个阶段都包括新的数据收集,以增加该数据集,以及研究阶段,旨在产生在这个新数据集上训练的模型,其性能目标不断提高。单独的数据收集是专门计划的,以跨越不同的地形、天气和大气条件,并加强对象的人口多样性。在该计划的第一阶段,BRIAR政府数据集1(BGC1)和2(BGC2)被设计用来支持针对这些问题的算法开发。
现有的人脸和WB识别算法在现实世界中的实现,通常是通过商业安全摄像机摄取视频媒体。这些传感器采集的数据质量不一,会降低算法的性能,是生物识别的一个重要缺陷[14]。为了在成像来源方面提供一个真正折衷的数据集,BRIAR数据集将包含不仅由商业监控摄像机捕获的图像和视频数据,而且由能够在高达1,000米的范围内和高达50°的视角下获得高质量的主体视频片段的专门传感器捕获的数据。
由于缺乏从安装在无人驾驶飞行器(UAV)平台上的传感器捕捉到的训练数据,生物识别算法的许多有前途的应用受到进一步限制。这种平台在商业、工业和国防应用中越来越多地出现。为了推动更新的算法,BRIAR BGC1和BGC2数据集还将包括从四个不同的平台上拍摄的高达400米的人脸和WB视频片段,这些平台都是静止的,在一次记录过程中沿着三个轴线改变位置。
BRIAR数据集有两个重大贡献。首先,它建立了一个独一无二的数据集,包括来自多个范围和海拔高度的受试者的静态图像和视频,跨越两套衣服。其次,它使研究人员能够通过利用数据集的独特性和它所提供的未开发的成像挑战来扩展目前最先进的算法。
有几个关键特征使这个数据集真正具有新颖性。尽管许多现有的数据集提供的图像和/或视频要么是完全受限的,要么是完全不受限的[16][18],但BRIAR数据集包含高质量的特写图像和受大气条件(如湍流、雨、阴影)影响的可变质量的不受限视频。每个主题的视频可以从小于10米的4K质量到距离达1,000米的高清晰度,并包括合作和不合作行为的表现。
该数据集的独特功能将使IARPA的研发团队能够推进当前在人脸和WB检测和识别以及人员跟踪和重新识别领域的技术水平。目前,BRIAR数据集可供美国政府(USG)研究人员及其承包商索取。有兴趣的各方应与作者联系,作者将把请求转给适当的美国政府代表。
本文的其余部分组织如下。在第2节中,我们提供了关于BRIAR数据集所要解决的局限性的背景信息,并讨论了数据集开发过程中的几个关键考虑。第3节对相关工作进行了考察,并总结了与收集该数据集有关的独特目标挑战。在第4节中,我们讨论了数据集的收集协议和方法,收集中使用的无约束成像的性质,以及收集地点的细节。在第5节中,我们描述了数据的后处理方法、元数据和注释的手段。在第6节中,我们提供了数据集的特点,并讨论了其目前状态下的局限性。最后,第7节介绍了未来扩展BRIAR数据集的路线图。