增强型语言模型:一项综述

这次演讲聚焦于最近的一些研究,这些研究中语言模型(LMs)被赋予了推理能力和使用工具的能力。前者被定义为将可能复杂的任务分解为更简单的子任务,而后者包括调用外部模块,如代码解释器。LMs可以单独或通过启发式方法结合这些增强效果,或者从示例中学习如何这样做。在坚持标准的缺失令牌预测目标的同时,这种增强型LMs可以使用各种可能的非参数化的外部模块来扩展其上下文处理能力,从而偏离纯语言建模范式,并被称为增强型语言模型(ALMs)。缺失令牌的目标允许ALMs学习推理,使用工具,甚至行动,同时仍然执行标准的自然语言任务,并在几个基准测试上超过大多数常规的LMs。

成为VIP会员查看完整内容
36

相关内容

大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品迭代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。
专知会员服务
27+阅读 · 2021年7月3日
少即是多?非参数语言模型,68页ppt
专知会员服务
23+阅读 · 2020年11月22日
【纽约大学Sean】神经文本退化:一致性和学习,93页ppt
专知会员服务
15+阅读 · 2020年10月18日
【ICML2020】统一预训练伪掩码语言模型
专知会员服务
25+阅读 · 2020年7月23日
「知识增强预训练语言模型」最新研究综述
专知
17+阅读 · 2022年11月18日
「PPT」深度学习中的不确定性估计
专知
27+阅读 · 2019年7月20日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
49+阅读 · 2021年9月11日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员