【ETHZ博士论文】人工智能模型错误的分类与缓解 - 专知VIP

会员服务 ·

11

人工智能 · 深度学习 ·

【ETHZ博士论文】人工智能模型错误的分类与缓解

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在过去十年中，深度学习领域取得了令人瞩目的成功。如今，神经网络模型几乎主导了所有主流基准测试排行榜，不仅被广泛部署于现实世界场景中，甚至在某些任务上已达到超越人类的水平。然而，这些模型在多个方面仍然脆弱，常常会出现意料之外的失败，其可靠性与可信度问题仍远未得到彻底解决。在本论文中，我们提出：若要推动神经模型的进一步发展，仅仅关注其准确率已不再足够，更需要系统地理解模型的错误模式，以深入探究剩余错误存在的原因以及如何有效缓解这些问题。

论文的第一部分提出了一个自动化的错误分类框架，能够对 IMAGENET 模型的所有预测错误进行分类，标注其错误类型与严重程度。借助该框架，我们对超过 900 个模型的错误分布进行了全面评估，发现 top-1 准确率与多标签准确率是各类错误比例的强预测指标。特别地，我们观察到，随着模型准确率的提升，严重错误的比例显著下降，这表明传统准确率指标可能低估了模型实际性能与进步的程度。

接着，我们进一步展示该分析框架的实用性，具体应用于研究 IMAGENET 模型在不同扰动条件下的错误分布。我们发现，在常见自然扰动（如随机噪声、模糊、天气变化与数字扰动）下，错误分布趋势与原始干净图像非常相似，并呈现出一致的扩展特性。相对而言，标准的非定向 PGD（Projected Gradient Descent）攻击所引发的严重错误比例反而更低，这一发现令人惊讶，也揭示了自然扰动与对抗扰动在错误分布上的根本差异。

基于上述发现，我们设计了若干种 PGD 攻击变体，这些变体能够诱发更严重的错误并显著降低模型的对抗鲁棒性。在将其中一种攻击方法融入对抗训练后，我们得到了更加准确且在某些设置下严重错误比例更低的模型。

最后，在论文的第三部分，我们从错误分类与分析转向错误缓解，尤其聚焦于公平性问题——目标是构建在不同个体与群体之间不产生歧视的模型。为此，我们提出了一种基于生成建模、对抗训练与随机平滑技术的表示学习方法，以实现并验证图像数据在高维空间下的个体公平性（individual fairness）。我们希望本论文的研究成果能够激励更多研究者将错误分析工具纳入机器学习模型的开发周期，从而推动模型向着更安全、更可靠的方向发展。

成为VIP会员查看完整内容

16

相关内容

人工智能

人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支。

【博士论文】深度学习中的推理不一致性及其缓解方法

【博士论文】深度学习中的推理不一致性及其缓解方法

专知会员服务

18+阅读 · 4月5日

【NUS博士论文】视频语义理解的因果模型

【NUS博士论文】视频语义理解的因果模型

专知会员服务

9+阅读 · 3月19日

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

专知会员服务

16+阅读 · 3月11日

【ETZH博士论文】数据驱动的人工智能

【ETZH博士论文】数据驱动的人工智能

专知会员服务

35+阅读 · 2月21日

【NTU博士论文】数据高效的深度多模态学习

【NTU博士论文】数据高效的深度多模态学习

专知会员服务

19+阅读 · 1月31日

【剑桥大学博士论文】深度记忆模型与部分可观察下的高效强化学习

【剑桥大学博士论文】深度记忆模型与部分可观察下的高效强化学习

专知会员服务

32+阅读 · 2024年12月18日

【MIT博士论文】高效深度学习计算的模型加速

【MIT博士论文】高效深度学习计算的模型加速

专知会员服务

29+阅读 · 2024年8月23日

【CMU博士论文】现代深度学习高效训练策略的进展：从隐式深度学习到语言模型及其拓展领域

【CMU博士论文】现代深度学习高效训练策略的进展：从隐式深度学习到语言模型及其拓展领域

专知会员服务

20+阅读 · 2024年7月5日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

专知会员服务

48+阅读 · 2022年9月14日

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

专知会员服务

26+阅读 · 2022年7月13日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

10+阅读 · 2022年10月31日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

【清华大学】知识图谱从哪里来：实体关系抽取的现状与未来

【清华大学】知识图谱从哪里来：实体关系抽取的现状与未来

专知

25+阅读 · 2019年11月17日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

23+阅读 · 2019年8月24日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

机器学习优化方法综述论文【附65页论文下载】

机器学习优化方法综述论文【附65页论文下载】

专知

34+阅读 · 2019年1月19日

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

人工智能前沿讲习班

11+阅读 · 2018年10月22日

【迁移学习】中科院计算所王晋东：迁移学习的发展和现状

【迁移学习】中科院计算所王晋东：迁移学习的发展和现状

产业智能官

22+阅读 · 2017年11月21日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向多自治域环境的信息中心网络缓存策略和机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

166+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

204+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

452+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

140+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

166+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

49+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

82+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

【博士论文】深度学习中的推理不一致性及其缓解方法

【博士论文】深度学习中的推理不一致性及其缓解方法

专知会员服务

18+阅读 · 4月5日

【NUS博士论文】视频语义理解的因果模型

【NUS博士论文】视频语义理解的因果模型

专知会员服务

9+阅读 · 3月19日

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

专知会员服务

16+阅读 · 3月11日

【ETZH博士论文】数据驱动的人工智能

【ETZH博士论文】数据驱动的人工智能

专知会员服务

35+阅读 · 2月21日

【NTU博士论文】数据高效的深度多模态学习

【NTU博士论文】数据高效的深度多模态学习

专知会员服务

19+阅读 · 1月31日

【剑桥大学博士论文】深度记忆模型与部分可观察下的高效强化学习

【剑桥大学博士论文】深度记忆模型与部分可观察下的高效强化学习

专知会员服务

32+阅读 · 2024年12月18日

【MIT博士论文】高效深度学习计算的模型加速

【MIT博士论文】高效深度学习计算的模型加速

专知会员服务

29+阅读 · 2024年8月23日

【CMU博士论文】现代深度学习高效训练策略的进展：从隐式深度学习到语言模型及其拓展领域

【CMU博士论文】现代深度学习高效训练策略的进展：从隐式深度学习到语言模型及其拓展领域

专知会员服务

20+阅读 · 2024年7月5日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

专知会员服务

48+阅读 · 2022年9月14日

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

专知会员服务

26+阅读 · 2022年7月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《“龙式无人机”——军事行动中的铝热剂无人机系统》47页

中文版 | 美陆军与空军通过"2025项目融合"协同重塑未来军事指挥控制体系

中文版 | 算法战场：人工智能、国家安全与不断演变的威胁格局

《美国国防部网络作战测试与评估指南手册》最新40页

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

10+阅读 · 2022年10月31日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

【清华大学】知识图谱从哪里来：实体关系抽取的现状与未来

【清华大学】知识图谱从哪里来：实体关系抽取的现状与未来

专知

25+阅读 · 2019年11月17日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

23+阅读 · 2019年8月24日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

机器学习优化方法综述论文【附65页论文下载】

机器学习优化方法综述论文【附65页论文下载】

专知

34+阅读 · 2019年1月19日

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

人工智能前沿讲习班

11+阅读 · 2018年10月22日

【迁移学习】中科院计算所王晋东：迁移学习的发展和现状

【迁移学习】中科院计算所王晋东：迁移学习的发展和现状

产业智能官

22+阅读 · 2017年11月21日

相关基金

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向多自治域环境的信息中心网络缓存策略和机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

166+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

204+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

452+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

140+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

166+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

49+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

82+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员