语音基础模型的进展历程近几个月来,关于文本基础模型能力的讨论激增,特别是大型语言模型(LLM)。LLM以其通用处理能力而闻名,可以使用适当的指令有效地执行各种任务。与文本不同,语音包含丰富的、分层的信息,需要不同的功能来满足不同的应用。这就提出了一个问题:我们距离开发能够理解和执行任务指令的语音基础模型还有多远?本报告深入探讨了语音处理中基础模型的演变,强调了三个重要阶段:具有特定任务头的共享编码器、具有自适应参数的通用模型和任务指令模型。首先介绍了语音处理通用性能基准(SUPERB),该基准评估了跨多个任务的共享编码器。然后,讨论转移到探索语音语言模型中提示的使用。本报告最后着重介绍Dynamic SUPERB,这是一个旨在评估语音处理任务教学模型的项目。

成为VIP会员查看完整内容
49

相关内容

天大最新《大型语言模型评估》全面综述,111页pdf
专知会员服务
80+阅读 · 2023年10月31日
【ACL2023教程】自然语言的复杂推理,240多页ppt
专知会员服务
52+阅读 · 2023年7月13日
专知会员服务
24+阅读 · 2021年10月12日
【KDD2020】图神经网络生成式预训练
专知
20+阅读 · 2020年7月3日
深度多模态表示学习综述论文,22页pdf
专知
28+阅读 · 2020年6月21日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
Arxiv
131+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
326+阅读 · 2023年3月31日
Arxiv
54+阅读 · 2023年3月26日
Arxiv
111+阅读 · 2023年3月24日
Arxiv
16+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员