【导读】隐私保护是当下AI技术应用大家比较关心的一个问题。最近来自西班牙马德里自治大学和德国达姆施塔特大学学者发布了《生物特征识别中的隐私增强技术综述》,提供了一个统一框架下的生物识别隐私增强技术的概念概述,非常值得关注!

隐私增强技术是实现基本数据保护原则的技术。在生物识别方面,已采用不同类型的加强私隐技术,以保护储存的生物识别数据,这些数据通常被列为敏感数据。在这方面,提出了各种分类法和概念分类,并开展了标准化规范。然而,这些努力主要集中在增强隐私的某些子类别技术上,因此缺乏普遍性。这项工作提供了一个统一框架下的生物识别隐私增强技术的概念概述。在每个处理步骤中将详细强调现有概念之间的关键方面和差异。讨论了现有方法的基本性质和局限性,并与数据保护技术和原则有关。此外,还提出了生物识别隐私增强技术评估的场景和方法。本文旨在作为生物特征数据保护领域的切入点,面向有经验的研究人员以及非专家。

存储不受保护的生物特征数据表示和不受保护的生物特征模板导致隐私问题。在图中,我们考虑人脸图像。类似的担忧也适用于其他生物特征。

隐私是一个宽泛的概念,它规定了个人保护其自由和私人生活不受干扰或侵扰的权利。隐私的范围包括几个领域,例如它假设社会学、经济和政治的角度[1],它已经被包括在许多定义人权的文件中。随着大数据、物联网、人工智能、云计算等相关技术的快速发展,多年来收集越来越多的个人数据和应用[2]已成为趋势。因此,隐私的含义和范围也随之演变,包括获得对收集和使用个人数据[3]的控制权的权利。2016年,欧盟出台了《通用数据保护条例》(GDPR),以保护个人处理其[4]个人数据的权利。《GDPR》描述了一些必须规范个人数据使用的原则。它们包括处理过程中的公平性、对it系统最初用途的充分性,以及防止未经授权的访问。为了满足这些要求,GDPR建议采用技术方法,如假名化,即在不使用额外信息的情况下,处理个人数据,使其不再属于特定的个人。GDPR考虑的其他方法是加密和数据最小化。此外,GDPR结合了设计隐私(PbD),这是Ann Cavoukian最初提出的概念,根据该概念,数据保护必须从其创建开始集成到一个系统中,以实现强大的隐私保护,而不减少其功能[5]。此外,PbD要求将IT系统中的隐私设置作为缺省激活。有趣的是,同一作者建议将PbD概念应用于处理生物特征数据的系统,因为存在数据滥用和安全漏洞的潜在问题。

生物特征数据是对人类特征的测量,目的是识别和描述个体。它们可以分为两类:i)生物[7]和ii)行为[7]。生物学数据与个体的身体有关,如指纹、面孔和虹膜,而行为数据则涉及个体的行为(即身体的功能),如按键、步态、特征和言语。生物特征数据被广泛应用于识别系统,因为它们对每个人都是独一无二的,不会被遗忘、丢失或转移给其他个人,因此这种认证因素比传统的基于知识和所有权的认证系统[8]具有明显的优势。生物识别系统已应用于各种应用场景和多种用途,如自动边境控制、高安全设施的访问控制、电子银行、医疗保健、执法法医、智能手机解锁等。在注册时,即注册时,通常存储生物特征数据作为生物特征参考。生物特征数据通常被表示为所谓的模板,即与个人相关的生物特征集,并与认证过程中提取的探针生物特征直接进行比较。例如,从指纹[9]中提取的细节,或从虹膜[10]中提取的二进制虹膜代码。根据[11],我们所指的术语是生物特征数据,包括人类特征的原始表示以及从这些特征中提取的特征。

生物特征数据的无保护存储引发了人们对其最终用途的隐私担忧。如果存储了原始表示(例如,捕获的样本,如人脸图像或指纹图像),它们可能会从服务器泄漏。攻击者可以通过破坏生物特征数据库来获取注册个体的生物特征数据,并最终模拟他们来访问相应的身份验证系统。此外,还可以从生物特征数据中获得进一步的信息,包括健康状况、情绪、软生物特征和其他个人方面[12]、[13]。此外,我们注意到存储处理过的生物特征数据(例如特征向量)并不是一个保护级别,因为在许多情况下,图像表示可以很容易地从生物特征重建,例如[14]。

软生物特征包含在生物特征数据中所包含的信息中,增加了识别个体的机会。软生物特征属性,如年龄、性别、种族等,可以从生物特征数据中自动提取,无需用户同意,并用于最初意想不到的目的。此外,如果多个系统中的个人注册了他们的生物特征数据被破坏,攻击者可以跨这些系统交叉匹配生物特征数据,以获得关于个人[15]的进一步分析信息。在图1中,我们总结了人脸图像的隐私问题。类似的担忧也出现在其他类型的生物特征上。根据[11]对生物特征数据的定义,在处理的任何阶段(如生物特征参考、探针、生物特征或生物特性)读取生物特征样本或生物特征样本的集合,我们将整个品种视为敏感数据,并制定和审查隐私增强技术(PETs)的应用,以提供上述隐私问题的解决方案。

软生物特征包含在生物特征数据中所包含的信息中,增加了识别个体的机会。软生物特征属性,如年龄、性别、种族等,可以从生物特征数据中自动提取,无需用户同意,并用于最初意想不到的目的。此外,如果多个系统中的个人注册了他们的生物特征数据被破坏,攻击者可以跨这些系统交叉匹配生物特征数据,以获得关于个人[15]的进一步分析信息。在图1中,我们总结了人脸图像的隐私问题。类似的担忧也出现在其他类型的生物特征上。根据[11]对生物特征数据的定义,在处理的任何阶段(如生物特征参考、探针、生物特征或生物特性)读取生物特征样本或生物特征样本的集合,我们将整个品种视为敏感数据,并制定和审查隐私增强技术(PETs)的应用,以提供上述隐私问题的解决方案。

我们发现,现有的基于生物特征数据保护的隐私增强方法不能成功地应用于生物特征识别系统中。例如,匿名技术提供了强有力的隐私保证,但阻止了个人的识别,消除了生物特征数据的效用。传统加密算法不能应用于生物特征数据,因为原始数据的微小变化,例如来自同一个体的多个生物特征数据测量之间不可避免的差异,会导致加密数据的剧烈变化。因此,加密的生物特征数据需要在比较之前解密,这对攻击者[16]有利。最后,必须指出的是,与其他数据相比,生物计量数据需要作出特别努力,以保护可从数据中轻松获得的额外信息,例如与被捕获对象的健康状况有关的信息。

在本文中,我们将适用于生物识别系统的PETs称为生物隐私增强技术(B-PETs),将B-PETs生成的数据称为受保护的生物特征数据。我们提供了具有实际相关性的概念总结,以便从业人员能够通过这项工作获得B-PET概念的全面概述,并根据他们的需要确定在应用中实现隐私增强的最佳方法。这一领域的现有调研没有履行准则的这一职能,并将其范围局限于B-PETs的具体(分)类。例如,在[17]、[18]中研究可取消的生物识别和生物识别密码系统,而在[19]中研究从生物识别数据中去除或隐藏特定信息。本文的目的是在一个一般的框架下收集不同的B-PETs,它们通常在文献中单独的工作中进行调研。特别是在[19]中,即使描述了广泛的B-PETs,其工作范围也仅限于根据数据最小化原则设计的技术。此外,与我们的B-PETs概念相反,文中描述的一些技术旨在防止通过生物特征数据识别个体,同时在涉及软生物特征属性的应用中保持生物特征数据的效用。在[20]中提出了宠物的一般分类法。与这项工作相比,我们只考虑将PETs应用于生物识别系统(B-PETs),并专注于在传输数据之上保护存储数据,因为后者涉及到的网络协议并不专属于生物识别数据。综上所述,我们的工作主要贡献如下:

  • 我们认为PETs在生物识别中的广泛应用,允许对增强隐私所考虑的不同方面和目标进行具体分析

  • 我们将重点放在一组完善的B-PETs类别上,并通过一个突出每个类别的属性、用途和奇点的一般框架的定义来研究它们。这样,读者就可以根据本概述中描述的优点和缺点,确定最适合其应用的B-PET

  • 我们根据现有BPETs类别满足特定隐私需求的能力,以及防止从其生成的受保护生物特征数据中提取敏感信息的能力,对其进行定性评估。在评估过程中,我们考虑了具有不同能力和B-PETs知识的攻击者

代表一般框架和技术方法考虑产生受保护的生物特征数据。虚线表示框架的一个可选组件。

本文其余部分的组织方式如下。在第二节中,我们介绍生物识别系统和B-PETs的基本原理。第3节描述了B-PETs的拟议一般框架,提供了不同类别B-PETs的详细信息。第4节提出了一些适合评估B-PETs的指标,并对不同攻击场景下考虑的B-PETs类别进行了评估。最后,第五部分对全文进行了总结,并指出了本研究领域未来的研究方向。

成为VIP会员查看完整内容
17

相关内容

移动边缘网络中联邦学习效率优化综述
专知会员服务
21+阅读 · 7月9日
「联邦学习隐私保护 」最新2022研究综述
专知会员服务
66+阅读 · 4月1日
专知会员服务
14+阅读 · 2021年8月6日
专知会员服务
38+阅读 · 2021年3月28日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
109+阅读 · 2020年3月25日
视频隐私保护技术综述
专知
3+阅读 · 1月19日
区块链隐私保护研究综述——祝烈煌详解
计算机研究与发展
14+阅读 · 2018年11月28日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
Arxiv
34+阅读 · 2021年9月11日
Arxiv
24+阅读 · 2021年2月17日
A survey on deep hashing for image retrieval
Arxiv
13+阅读 · 2020年6月10日
Arxiv
13+阅读 · 2020年5月20日
已删除
Arxiv
26+阅读 · 2020年3月23日
Arxiv
21+阅读 · 2019年3月25日
Deep Face Recognition: A Survey
Arxiv
14+阅读 · 2019年2月12日
Arxiv
10+阅读 · 2018年1月18日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
相关论文
Arxiv
34+阅读 · 2021年9月11日
Arxiv
24+阅读 · 2021年2月17日
A survey on deep hashing for image retrieval
Arxiv
13+阅读 · 2020年6月10日
Arxiv
13+阅读 · 2020年5月20日
已删除
Arxiv
26+阅读 · 2020年3月23日
Arxiv
21+阅读 · 2019年3月25日
Deep Face Recognition: A Survey
Arxiv
14+阅读 · 2019年2月12日
Arxiv
10+阅读 · 2018年1月18日
微信扫码咨询专知VIP会员