检测预训练编码器中的后门 (Detecting Backdoors in Pre-trained Encoders) - 专知论文

会员服务 ·

0

图像编码器 · 预训练 · 图像编码 · 分类器 · 监督学习 ·

2023 年 3 月 23 日

Detecting Backdoors in Pre-trained Encoders

翻译：检测预训练编码器中的后门

Shiwei Feng,Guanhong Tao,Siyuan Cheng,Guangyu Shen,Xiangzhe Xu,Yingqi Liu,Kaiyuan Zhang,Shiqing Ma,Xiangyu Zhang

from arxiv, Accepted at CVPR 2023. Code is available at https://github.com/GiantSeaweed/DECREE

Self-supervised learning in computer vision trains on unlabeled data, such as images or (image, text) pairs, to obtain an image encoder that learns high-quality embeddings for input data. Emerging backdoor attacks towards encoders expose crucial vulnerabilities of self-supervised learning, since downstream classifiers (even further trained on clean data) may inherit backdoor behaviors from encoders. Existing backdoor detection methods mainly focus on supervised learning settings and cannot handle pre-trained encoders especially when input labels are not available. In this paper, we propose DECREE, the first backdoor detection approach for pre-trained encoders, requiring neither classifier headers nor input labels. We evaluate DECREE on over 400 encoders trojaned under 3 paradigms. We show the effectiveness of our method on image encoders pre-trained on ImageNet and OpenAI's CLIP 400 million image-text pairs. Our method consistently has a high detection accuracy even if we have only limited or no access to the pre-training dataset.

翻译：自监督学习在计算机视觉中使用无标签数据（如图像或（图像，文本）对）训练图像编码器，以获取对输入数据的高质量嵌入。针对编码器的新型后门攻击暴露了自监督学习的重要漏洞，因为下游分类器（甚至在干净数据上进一步训练的分类器）可能会从编码器中继承后门行为。现有的后门检测方法主要集中在监督学习环境中，并且不能处理预训练编码器，特别是当没有输入标签时。在本文中，我们提出了 DECREE，这是首个用于预训练编码器的后门检测方法，不需要分类器标头或输入标签。我们在超过 400 个在三种范例下被欺诈的编码器上评估了 DECREE。我们展示了我们的方法在预训练于 ImageNet 和 OpenAI 的 CLIP 400 百万图像文本对的图像编码器上的效果。即使我们仅有有限或没有访问预训练数据集，我们的方法始终具有很高的检测准确率。

2

相关内容

图像编码器

图像编码器

ICML2023 | 轻量级视觉Transformer(ViT)的预训练实践手册

ICML2023 | 轻量级视觉Transformer(ViT)的预训练实践手册

专知会员服务

41+阅读 · 2023年5月10日

百篇论文纵览大型语言模型最新研究进展

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

ICCV'21 Oral｜拒绝调参，显著提点！检测分割任务的新损失函数RS Loss开源

专知会员服务

16+阅读 · 2021年8月11日

近期必读的5篇顶会CVPR 2021【图像分类】相关论文和代码

专知会员服务

80+阅读 · 2021年4月7日

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

专知会员服务

66+阅读 · 2020年10月20日

【ACL2020-CMU】预训练模型权重攻击，Weight Poisoning Attacks on PTM

【ACL2020-CMU】预训练模型权重攻击，Weight Poisoning Attacks on PTM

专知会员服务

12+阅读 · 2020年4月16日

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

专知会员服务

78+阅读 · 2020年2月25日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

【下载】Python自然语言处理实战书籍和代码《Natural Language Processing in Action》

【下载】Python自然语言处理实战书籍和代码《Natural Language Processing in Action》

专知会员服务

80+阅读 · 2019年10月27日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

CVPR2019| 04-17更新17篇论文及代码（目标检测、语义分割、损失函数、姿态估计等）

CVPR2019| 04-17更新17篇论文及代码（目标检测、语义分割、损失函数、姿态估计等）

极市平台

24+阅读 · 2019年4月17日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

tensorflow Object Detection API使用预训练模型mask r-cnn实现对象检测

tensorflow Object Detection API使用预训练模型mask r-cnn实现对象检测

极市平台

12+阅读 · 2018年8月24日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【代码资源】GAN | 七份最热GAN文章及代码分享（Github 1000+Stars）

【代码资源】GAN | 七份最热GAN文章及代码分享（Github 1000+Stars）

专知

13+阅读 · 2018年6月24日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

专知

15+阅读 · 2018年2月3日

【论文推荐】最新5篇目标检测相关论文——显著目标检测、弱监督One-Shot检测、多框检测器、携带物体检测、假彩色图像检测

【论文推荐】最新5篇目标检测相关论文——显著目标检测、弱监督One-Shot检测、多框检测器、携带物体检测、假彩色图像检测

专知

74+阅读 · 2018年1月16日

可解释的CNN

可解释的CNN

CreateAMind

17+阅读 · 2017年10月5日

基于知识库构建的图像和视频角色语义关系的研究

国家自然科学基金

1+阅读 · 2015年12月31日

稀有变异的有效发现与识别

国家自然科学基金

0+阅读 · 2013年12月31日

外加应力及含水蒸气环境中CoNiCrAlY涂层表面氧化层的生长机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

具有催化活性的后过渡金属氧合簇的设计与组装

国家自然科学基金

0+阅读 · 2012年12月31日

“开关型”荧光纳米探针用于活细胞内生物分子的检测

国家自然科学基金

0+阅读 · 2012年12月31日

基于纳米金柱阵列结构的原子力显微镜探针针尖形貌盲重构

国家自然科学基金

0+阅读 · 2012年12月31日

基于鲁棒的中国余数定理的无线安全传输方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

超精度视频内容三维重建

国家自然科学基金

0+阅读 · 2011年12月31日

图像稀疏表示在统计不可检测安全隐写中的应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于离子交换的电极表面金属纳米微粒的原位构筑及其对生物分子的选择性检测

国家自然科学基金

0+阅读 · 2008年12月31日

UOR: Universal Backdoor Attacks on Pre-trained Language Models

Arxiv

0+阅读 · 2023年5月16日

CodeT5+: Open Code Large Language Models for Code Understanding and Generation

Arxiv

0+阅读 · 2023年5月13日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

AMMUS : A Survey of Transformer-based Pretrained Models in Natural Language Processing

Arxiv

23+阅读 · 2021年8月12日

Backdoor Learning: A Survey

Arxiv

14+阅读 · 2020年10月26日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Interpretable CNNs for Object Classification

Interpretable CNNs for Object Classification

Arxiv

20+阅读 · 2020年3月12日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

MV-YOLO: Motion Vector-aided Tracking by Semantic Object Detection

Arxiv

10+阅读 · 2018年4月30日

Transferring Common-Sense Knowledge for Object Detection

Arxiv

12+阅读 · 2018年4月3日

VIP会员

文章信息

相关主题

图像编码器

相关VIP内容

ICML2023 | 轻量级视觉Transformer(ViT)的预训练实践手册

ICML2023 | 轻量级视觉Transformer(ViT)的预训练实践手册

专知会员服务

41+阅读 · 2023年5月10日

百篇论文纵览大型语言模型最新研究进展

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

ICCV'21 Oral｜拒绝调参，显著提点！检测分割任务的新损失函数RS Loss开源

专知会员服务

16+阅读 · 2021年8月11日

近期必读的5篇顶会CVPR 2021【图像分类】相关论文和代码

专知会员服务

80+阅读 · 2021年4月7日

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

专知会员服务

66+阅读 · 2020年10月20日

【ACL2020-CMU】预训练模型权重攻击，Weight Poisoning Attacks on PTM

【ACL2020-CMU】预训练模型权重攻击，Weight Poisoning Attacks on PTM

专知会员服务

12+阅读 · 2020年4月16日

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

【CVPR2020】用于细粒度动作识别的多模式域自适应，Multi-Modal Domain Adaptation for Fine-Grained Action Recognition

专知会员服务

78+阅读 · 2020年2月25日

【Google AI】开源NoisyStudent：自监督图像分类

【Google AI】开源NoisyStudent：自监督图像分类

专知会员服务

55+阅读 · 2020年2月18日

【下载】Python自然语言处理实战书籍和代码《Natural Language Processing in Action》

【下载】Python自然语言处理实战书籍和代码《Natural Language Processing in Action》

专知会员服务

80+阅读 · 2019年10月27日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】面向企业的图学习扩展：生产级图学习与推理，485页pdf

AI智能体编程：技术、挑战与机遇综述

【国家标准】数据安全技术数据安全风险评估方法

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

相关资讯

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

CVPR2019| 04-17更新17篇论文及代码（目标检测、语义分割、损失函数、姿态估计等）

CVPR2019| 04-17更新17篇论文及代码（目标检测、语义分割、损失函数、姿态估计等）

极市平台

24+阅读 · 2019年4月17日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

tensorflow Object Detection API使用预训练模型mask r-cnn实现对象检测

tensorflow Object Detection API使用预训练模型mask r-cnn实现对象检测

极市平台

12+阅读 · 2018年8月24日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【代码资源】GAN | 七份最热GAN文章及代码分享（Github 1000+Stars）

【代码资源】GAN | 七份最热GAN文章及代码分享（Github 1000+Stars）

专知

13+阅读 · 2018年6月24日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

专知

15+阅读 · 2018年2月3日

【论文推荐】最新5篇目标检测相关论文——显著目标检测、弱监督One-Shot检测、多框检测器、携带物体检测、假彩色图像检测

【论文推荐】最新5篇目标检测相关论文——显著目标检测、弱监督One-Shot检测、多框检测器、携带物体检测、假彩色图像检测

专知

74+阅读 · 2018年1月16日

可解释的CNN

可解释的CNN

CreateAMind

17+阅读 · 2017年10月5日

相关论文

UOR: Universal Backdoor Attacks on Pre-trained Language Models

Arxiv

0+阅读 · 2023年5月16日

CodeT5+: Open Code Large Language Models for Code Understanding and Generation

Arxiv

0+阅读 · 2023年5月13日

A Survey of Visual Transformers

Arxiv

39+阅读 · 2021年11月11日

AMMUS : A Survey of Transformer-based Pretrained Models in Natural Language Processing

Arxiv

23+阅读 · 2021年8月12日

Backdoor Learning: A Survey

Arxiv

14+阅读 · 2020年10月26日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Interpretable CNNs for Object Classification

Interpretable CNNs for Object Classification

Arxiv

20+阅读 · 2020年3月12日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

MV-YOLO: Motion Vector-aided Tracking by Semantic Object Detection

Arxiv

10+阅读 · 2018年4月30日

Transferring Common-Sense Knowledge for Object Detection

Arxiv

12+阅读 · 2018年4月3日

相关基金

基于知识库构建的图像和视频角色语义关系的研究

国家自然科学基金

1+阅读 · 2015年12月31日

稀有变异的有效发现与识别

国家自然科学基金

0+阅读 · 2013年12月31日

外加应力及含水蒸气环境中CoNiCrAlY涂层表面氧化层的生长机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

具有催化活性的后过渡金属氧合簇的设计与组装

国家自然科学基金

0+阅读 · 2012年12月31日

“开关型”荧光纳米探针用于活细胞内生物分子的检测

国家自然科学基金

0+阅读 · 2012年12月31日

基于纳米金柱阵列结构的原子力显微镜探针针尖形貌盲重构

国家自然科学基金

0+阅读 · 2012年12月31日

基于鲁棒的中国余数定理的无线安全传输方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

超精度视频内容三维重建

国家自然科学基金

0+阅读 · 2011年12月31日

图像稀疏表示在统计不可检测安全隐写中的应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于离子交换的电极表面金属纳米微粒的原位构筑及其对生物分子的选择性检测

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员