本报告详细介绍了在 DARPA LwLL 或 "少标签学习 "项目中采用的方法和取得的成果。

本报告解决的关键问题是从小标签数据集学习的问题。这是许多应用领域经常遇到的问题。尤其是在国防应用领域,标签数据可能是分类数据,因此数量有限。不幸的是,现代深度学习系统需要大量的标注训练示例,这使得它们在标注较少的情况下效果不佳。在本报告中,我们将介绍我们在开发新型学习机器方面所做的努力,这些机器可以有效地从少量标签中学习。

我们对这一问题的主要见解是利用任务和领域中的结构。这种结构可以是关于所需不变性的领域知识。它也可能更无定形,难以具体化,但它可能决定了哪些分类器能在该领域发挥良好的作用。我们探索了三种纳入这种领域结构思想的方法:

1.纳入已知不变量: 我们探索了明确包含已知不变量的机器学习新架构。特别是,我们设计的识别架构允许特征在空间上移动,以纳入姿势不变性。

2.跨领域学习: 考虑到不同领域之间的相似性,我们探索了跨领域传输所学模型的新技术。

3.特定领域的学习算法: 我们还探索了两个领域的专业学习技术:卫星图像和自动驾驶汽车。对于这些领域,我们利用数据的特殊结构来学习无标签模型。

使用标准基准和 DARPA 评估进行了实验。普遍发现

1.在对领域一无所知的情况下,最佳策略是自我训练,即使用经过适当过滤的网络自身输出作为 "地面实况 "标签。在这里,我们发现了进行自我训练的新方法,即使网络是在完全不同的问题领域中训练出来的。

2.如果我们了解我们正在处理的领域,我们甚至可以建立完全无监督的识别模型,其性能优于有监督的模型。关键是要利用底层数据生成过程的知识。我们在卫星图像和自动驾驶汽车上都展示了结果。

成为VIP会员查看完整内容
53

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
【2023新书】机器学习中的表示学习,101页pdf
专知会员服务
126+阅读 · 2023年2月3日
首篇「课程学习(Curriculum Learning)」2021综述论文
专知会员服务
49+阅读 · 2021年1月31日
【2022新书】深度学习归一化技术,117页pdf
专知
24+阅读 · 2022年11月25日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
407+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员