翻译标题：不仅仅是漂亮的图片：文本到图像生成器实现可解释性干预以实现强健表示翻译摘要：已知神经图像分类器在面对表现出与训练分布的协变量转移的输入时会出现严重性能退化。本文展示最近文本到图像（T2I）生成器的能力，即通过自然语言提示来编辑图像，以实现更强健的分类器的训练，是一种有前途的技术。使用现有的开源模型，我们发现各种提示策略都能有效生成足够的增强训练数据集，以达到以下三个方面的最新成果：（1）在广泛采用的单域泛化基准测试中，（2）减少分类器对虚假特征的依赖性，（3）减少培训领域较少时的多域泛化技术的应用。 (Not Just Pretty Pictures: Text-to-Image Generators Enable Interpretable Interventions for Robust Representations)

翻译：翻译标题：不仅仅是漂亮的图片：文本到图像生成器实现可解释性干预以实现强健表示翻译摘要：已知神经图像分类器在面对表现出与训练分布的协变量转移的输入时会出现严重性能退化。本文展示最近文本到图像（T2I）生成器的能力，即通过自然语言提示来编辑图像，以实现更强健的分类器的训练，是一种有前途的技术。使用现有的开源模型，我们发现各种提示策略都能有效生成足够的增强训练数据集，以达到以下三个方面的最新成果：（1）在广泛采用的单域泛化基准测试中，（2）减少分类器对虚假特征的依赖性，（3）减少培训领域较少时的多域泛化技术的应用。

Jianhao Yuan,Francesco Pinto,Adam Davies,Aarushi Gupta,Philip Torr

Neural image classifiers are known to undergo severe performance degradation when exposed to input that exhibits covariate shift with respect to the training distribution. In this paper, we show that recent Text-to-Image (T2I) generators' ability to edit images to approximate interventions via natural-language prompts is a promising technology to train more robust classifiers. Using current open-source models, we find that a variety of prompting strategies are effective for producing augmented training datasets sufficient to achieve state-of-the-art performance (1) in widely adopted Single-Domain Generalization benchmarks, (2) in reducing classifiers' dependency on spurious features and (3) facilitating the application of Multi-Domain Generalization techniques when fewer training domains are available.

翻译：

相关内容

分类器

关注 6

分类是数据挖掘的一种非常重要的方法。分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型（即我们通常所说的分类器(Classifier)）。该函数或模型能够把数据库中的数据纪录映射到给定类别中的某一个，从而可以应用于数据预测。总之，分类器是数据挖掘中对样本进行分类的方法的统称，包含决策树、逻辑回归、朴素贝叶斯、神经网络等算法。

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

专知会员服务

32+阅读 · 2023年5月19日

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

专知会员服务

31+阅读 · 2023年4月7日

【CVPR 2022】多模态视频字幕的端到端生成预训练，End-to-end Generative Pretraining for Multimodal Video Captioning

专知会员服务

27+阅读 · 2022年3月3日

【干货书】机器学习设计模式，408页pdf，Machine Learning Design Patterns

专知会员服务

138+阅读 · 2022年2月6日