虽然大规模语言模型工作得非常好,但训练它们的成本很高,很难解释它们的预测,而且几乎不可能随着时间的推移保持最新。目前还不清楚我们什么时候可以相信他们的预测,而且目前的大型语言模型都不能回答关于当前主题的问题,例如COVID-19,因为用于训练的语料库是几年前创建的。为了开发具有更小、更简单和更有效的模型的下一代通用语言模型,我们相信信息检索是一个关键组件。在人与人之间以及与世界进行交互时,人类会挖掘许多不同形式的知识,包括世界知识(例如常识、最新的世界事实、热门新闻)和用户知识(例如对话记忆、社交互动、额外的上下文(例如位置等)。为了在AI应用程序中结合这种能力,信息检索提供了模型对可能包含此类知识的文档集合的访问(可能很大)。具体来说,完整的系统由一个小型的核心模型组成,可以通过检索轻松访问额外的、与任务相关的知识,并与当今最大的语言模型相媲美。在本次演讲中,我将首先对检索增强语言模型进行研究概述。然后,我将分享我们最近的一些工作,包括一个通过添加检索组件来改进任何语言模型的通用框架,以及一个检索增强的多模态模型,该模型可以生成质量更好的图像和标题。最后,我将通过讨论我们学到的一些经验教训和我们计划在不久的将来解决的问题来结束这次演讲。

成为VIP会员查看完整内容
56

相关内容

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习
专知会员服务
48+阅读 · 2021年12月20日
专知会员服务
79+阅读 · 2021年7月3日
【AAAI2021】预训练语言模型最新进展,附113页ppt和视频
专知会员服务
64+阅读 · 2021年2月23日
【AAAI2021】以事件为中心的自然语言理解,256页ppt
专知会员服务
73+阅读 · 2021年2月8日
【GPT-3作者亲解】超大型语言模型少样本学习,109页ppt
专知会员服务
107+阅读 · 2020年12月19日
Python NLP 入门教程
大数据技术
19+阅读 · 2017年10月24日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
Arxiv
20+阅读 · 2021年9月21日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员