【MIT博士论文】机器学习模型调试的有效工具，149页pdf - 专知VIP

会员服务 ·

30

博士论文 · 机器学习 · 模型调试 · 模型诊断 ·

2023 年 3 月 29 日

【MIT博士论文】机器学习模型调试的有效工具，149页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文解决了检测和修复机器学习(ML)模型-模型调试中的错误的挑战。当前的机器学习模型，特别是在众包数据上训练的过参数化深度神经网络(DNN)，很容易锁定虚假信号，在小群体中表现不佳，并可能因训练标签中的错误而偏离正轨。因此，在部署之前检测和修复模型错误的能力是至关重要的。可解释的机器学习方法，特别是事后解释，已经成为事实上的ML模型调试工具。目前存在大量的方法，但不清楚这些方法是否有效。在本文的第一部分中，我们介绍了一个框架，对标准监督学习流程中可能出现的模型错误进行分类。在分类的基础上，评估了几种事后模型解释方法对检测和修复框架中提出的缺陷类别是否有效。目前的方法很难检测模型对虚假信号的依赖，无法识别具有错误标签的训练输入，也没有提供直接的方法来修复模型错误。此外，实践者在实践中很难使用这些工具来调试ML模型。针对现有方法的局限性，在论文的第二部分，我们提出了新的模型调试工具。本文提出一种称为模型指导的方法，用一个审计集(一个由任务专家仔细注释的小型数据集)来更新预训练机器学习模型的参数。将更新表述为一个双层优化问题，要求更新的模型匹配专家在审计集上的预测和特征注释。模型引导可用于识别和纠正错误标记的示例。同样，该方法还可以消除模型对虚假训练信号的依赖。本文介绍的第二个调试工具使用估计器的影响函数来帮助识别训练点，其标签对ML模型的视差度量有很高的影响，如组校准。总之，本文在为机器学习模型提供更好的调试工具方面取得了进展。

成为VIP会员查看完整内容

48

相关内容

博士论文

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【MIT博士论文】机器学习模型鲁棒性的探索、改进与验证，208页pdf

【MIT博士论文】机器学习模型鲁棒性的探索、改进与验证，208页pdf

专知会员服务

47+阅读 · 2023年4月2日

机器学习模型如何可靠？191页最新《机器学习模型在户外的鲁棒性、评估和自适应》博士论文

机器学习模型如何可靠？191页最新《机器学习模型在户外的鲁棒性、评估和自适应》博士论文

专知会员服务

46+阅读 · 2023年3月11日

【MIT博士论文】多模态模型学习语言，138页pdf

【MIT博士论文】多模态模型学习语言，138页pdf

专知会员服务

58+阅读 · 2022年12月23日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知会员服务

95+阅读 · 2022年10月5日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

59+阅读 · 2022年9月7日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知会员服务

52+阅读 · 2022年8月31日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知会员服务

56+阅读 · 2022年4月19日

【斯坦福博士论文】机器学习的模型解释和数据评估，206页pdf

专知会员服务

127+阅读 · 2021年8月3日

【牛津大学博士论文】解释深度神经网络，134页pdf

【牛津大学博士论文】解释深度神经网络，134页pdf

专知会员服务

220+阅读 · 2020年10月8日

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

专知

6+阅读 · 2022年11月11日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

10+阅读 · 2022年10月15日

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

专知

6+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知

9+阅读 · 2022年10月4日

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持，235页pdf

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持，235页pdf

专知

9+阅读 · 2022年9月10日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

数据驱动的被动协议测试方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于微分几何和机器学习的立体视觉研究

国家自然科学基金

2+阅读 · 2013年12月31日

构件软件的回归测试及复杂性度量研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向不平衡样本的流形学习故障诊断方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于三元粗糙输出编码的带自适应惩罚因子的支持向量机多分类模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

用于交互式视频检索的教练式主动学习模型

国家自然科学基金

0+阅读 · 2012年12月31日

非平稳时间序列的非参数预测回归

国家自然科学基金

7+阅读 · 2012年12月31日

基于解释/归纳策略的汽车变速箱新产品故障诊断机器学习方法研究

国家自然科学基金

1+阅读 · 2009年12月31日

Quiver: Supporting GPUs for Low-Latency, High-Throughput GNN Serving with Workload Awareness

Arxiv

0+阅读 · 2023年5月18日

BakedSDF: Meshing Neural SDFs for Real-Time View Synthesis

Arxiv

0+阅读 · 2023年5月16日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

Survey on Evolutionary Deep Learning: Principles, Algorithms, Applications and Open Issues

Arxiv

20+阅读 · 2022年8月23日

Towards Large-Scale Small Object Detection: Survey and Benchmarks

Arxiv

40+阅读 · 2022年7月28日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

ProtGNN: Towards Self-Explaining Graph Neural Networks

Arxiv

22+阅读 · 2021年12月2日

已删除

Arxiv

32+阅读 · 2020年3月23日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

VIP会员

相关主题

相关VIP内容

【MIT博士论文】机器学习模型鲁棒性的探索、改进与验证，208页pdf

【MIT博士论文】机器学习模型鲁棒性的探索、改进与验证，208页pdf

专知会员服务

47+阅读 · 2023年4月2日

机器学习模型如何可靠？191页最新《机器学习模型在户外的鲁棒性、评估和自适应》博士论文

机器学习模型如何可靠？191页最新《机器学习模型在户外的鲁棒性、评估和自适应》博士论文

专知会员服务

46+阅读 · 2023年3月11日

【MIT博士论文】多模态模型学习语言，138页pdf

【MIT博士论文】多模态模型学习语言，138页pdf

专知会员服务

58+阅读 · 2022年12月23日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知会员服务

95+阅读 · 2022年10月5日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

59+阅读 · 2022年9月7日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知会员服务

52+阅读 · 2022年8月31日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知会员服务

56+阅读 · 2022年4月19日

【斯坦福博士论文】机器学习的模型解释和数据评估，206页pdf

专知会员服务

127+阅读 · 2021年8月3日

【牛津大学博士论文】解释深度神经网络，134页pdf

【牛津大学博士论文】解释深度神经网络，134页pdf

专知会员服务

220+阅读 · 2020年10月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《生成式人工智能与大/小语言模型在供应链管理决策优化与可持续性提升中的作用评估》最新51页

白宫发布《赢得AI竞赛：美国人工智能行动计划》最新28页

地下战：地下空间的战略博弈

《美地下作战条令手册》228页

相关资讯

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

专知

6+阅读 · 2022年11月11日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

10+阅读 · 2022年10月15日

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

专知

6+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知

9+阅读 · 2022年10月4日

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持，235页pdf

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持，235页pdf

专知

9+阅读 · 2022年9月10日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

相关基金

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

数据驱动的被动协议测试方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于微分几何和机器学习的立体视觉研究

国家自然科学基金

2+阅读 · 2013年12月31日

构件软件的回归测试及复杂性度量研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向不平衡样本的流形学习故障诊断方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于三元粗糙输出编码的带自适应惩罚因子的支持向量机多分类模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

用于交互式视频检索的教练式主动学习模型

国家自然科学基金

0+阅读 · 2012年12月31日

非平稳时间序列的非参数预测回归

国家自然科学基金

7+阅读 · 2012年12月31日

基于解释/归纳策略的汽车变速箱新产品故障诊断机器学习方法研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Quiver: Supporting GPUs for Low-Latency, High-Throughput GNN Serving with Workload Awareness

Arxiv

0+阅读 · 2023年5月18日

BakedSDF: Meshing Neural SDFs for Real-Time View Synthesis

Arxiv

0+阅读 · 2023年5月16日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

Survey on Evolutionary Deep Learning: Principles, Algorithms, Applications and Open Issues

Arxiv

20+阅读 · 2022年8月23日

Towards Large-Scale Small Object Detection: Survey and Benchmarks

Arxiv

40+阅读 · 2022年7月28日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

ProtGNN: Towards Self-Explaining Graph Neural Networks

Arxiv

22+阅读 · 2021年12月2日

已删除

Arxiv

32+阅读 · 2020年3月23日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

微信扫码咨询专知VIP会员