机器学习和人工智能领域在过去十年中取得了显著进展。得益于计算和算法的进步,以及大数据集的可获取性,它已经从纯粹的学术研究发展到以工业为主导的领域。随着企业开始在其专有数据集上训练模型,数据质量的重要性作为一个关键因素浮现出来,与传统的模型架构改进并行。因此,数据驱动的人工智能(Data-Centric AI,简称DCAI)开发方法应运而生,侧重于通过系统的数据管理(数据收集、标注和策划)来提升模型性能,而非单纯改善模型本身。

本论文旨在通过全面的文献综述,探讨数据驱动的人工智能(DCAI)这一新兴范式,涵盖DCAI所涉及的广泛主题。此外,论文展示了三个关键子主题的三篇发表论文:第一篇论文提出了一种新的主动学习方法,适用于高度不平衡的数据集,帮助解决工业应用中常见的类别不平衡问题。第二篇论文介绍了MC层归一化(MC Layer Normalization),这是一种替代常规层归一化的方法,通过在特征子采样过程中引入随机性,能够在神经网络中进行不确定性估计。最后,第三篇论文提出了一个名为Softmatcher的视觉提示框架,用于交互式图像分割。该框架将基础模型与高效的概率特征匹配过程结合,使得通过视觉提示实现快速、无训练的图像分割成为可能。 这三种方法成功集成到多个IBM产品中,为研究在工业环境中的适用性和影响力提供了有力的证据。本论文展示了数据驱动方法的潜力,表明通过持续关注数据质量,可以在较低成本和更短时间内开发出显著改进的机器学习模型。

成为VIP会员查看完整内容
11

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【NTU博士论文】数据高效的深度多模态学习
专知会员服务
18+阅读 · 1月31日
【CUHK博士论文】现代机器学习中的因果性学习
专知会员服务
30+阅读 · 1月24日
【CMU博士论文】使用数据不确定解释的可信学习
专知会员服务
25+阅读 · 2024年11月2日
【MIT博士论文】高效深度学习计算的模型加速
专知会员服务
28+阅读 · 2024年8月23日
【博士论文】社交与对抗性数据源下的可信机器学习
专知会员服务
18+阅读 · 2024年8月9日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
【CAA智库】高文院士:转向跨媒体智能
中国自动化学会
22+阅读 · 2018年8月20日
【机器学习】如何通过机器学习预测维护设备?
产业智能官
16+阅读 · 2018年7月9日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
431+阅读 · 2023年3月31日
Arxiv
157+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关资讯
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员