现如今,从日益增长的数据中提取有用的信息以作出知情决策变得越来越具有挑战性。尽管深度学习在最近有所进步,但如何有效且可扩展地利用如此庞大的数据去处理各种任务的问题尚未解决。为了解决从数据中进行表示学习的两个主要方面,即效率和可扩展性,这篇论文介绍了处理各种任务的技术,包括情感分析,手写识别和文档智能,这些任务的数据形式各不相同:包括文本,音频和视频的多模态数据,噪声扫描手写图像,或者布局不同的长文档。由于各自数据的可获得性和可能存在的问题,以及相关任务的明确目标,没有一种通用的解决方案,而是对每个问题都有特定的方法。另外,为了处理大规模数据,本论文还介绍了一些近似技术和分析方法,用于估计基本组件,学习有效的表示,并加速学习过程,包括使用并行非自适应方法进行矩阵迹近似,高斯过程训练中的谱近似,以及用于大规模多任务神经机器翻译模型的基于任务的专家混合模型。在这些工作中,这篇论文介绍了应对数据和任务中出现的问题,学习有效表示,以及为实际可扩展性近似模型的新颖方法。

成为VIP会员查看完整内容
37

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【伯克利博士论文】数据与标签高效表示学习,114页pdf
专知会员服务
51+阅读 · 2023年2月20日
【MIT博士论文】异构医疗数据表示学习,193页pdf
专知会员服务
57+阅读 · 2022年9月3日
【MIT博士论文】控制神经语言生成,147页pdf
专知会员服务
21+阅读 · 2022年9月2日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
139+阅读 · 2023年3月24日
VIP会员
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员