【AAAI2023】基于检索增强语言模型的高效可扩展NLP，72页ppt - 专知VIP

会员服务 ·

23

AAAI 2023 · 语言模型 ·

2023 年 2 月 20 日

【AAAI2023】基于检索增强语言模型的高效可扩展NLP，72页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

虽然大规模语言模型工作得非常好，但训练它们的成本很高，很难解释它们的预测，而且几乎不可能随着时间的推移保持最新。目前还不清楚我们什么时候可以相信他们的预测，而且目前的大型语言模型都不能回答关于当前主题的问题，例如COVID-19，因为用于训练的语料库是几年前创建的。为了开发具有更小、更简单和更有效的模型的下一代通用语言模型，我们相信信息检索是一个关键组件。在人与人之间以及与世界进行交互时，人类会挖掘许多不同形式的知识，包括世界知识(例如常识、最新的世界事实、热门新闻)和用户知识(例如对话记忆、社交互动、额外的上下文(例如位置等)。为了在AI应用程序中结合这种能力，信息检索提供了模型对可能包含此类知识的文档集合的访问(可能很大)。具体来说，完整的系统由一个小型的核心模型组成，可以通过检索轻松访问额外的、与任务相关的知识，并与当今最大的语言模型相媲美。在本次演讲中，我将首先对检索增强语言模型进行研究概述。然后，我将分享我们最近的一些工作，包括一个通过添加检索组件来改进任何语言模型的通用框架，以及一个检索增强的多模态模型，该模型可以生成质量更好的图像和标题。最后，我将通过讨论我们学到的一些经验教训和我们计划在不久的将来解决的问题来结束这次演讲。

成为VIP会员查看完整内容

57

相关内容

AAAI 2023

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

专知会员服务

69+阅读 · 2021年3月18日

【AAAI2021】以事件为中心的自然语言理解，256页ppt

【AAAI2021】以事件为中心的自然语言理解，256页ppt

专知会员服务

74+阅读 · 2021年2月8日

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

专知会员服务

110+阅读 · 2020年12月19日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

专知

0+阅读 · 2022年8月24日

【KDD2022教程】Transformers多模态数据分类，41页ppt

【KDD2022教程】Transformers多模态数据分类，41页ppt

专知

0+阅读 · 2022年8月18日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

通用Web结构化信息检索引擎的关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于图的大规模异质信息网络的匹配查询关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于语言理解的机器翻译方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

句子语义的视觉表示研究

国家自然科学基金

4+阅读 · 2009年12月31日

RadTex: Learning Efficient Radiograph Representations from Text Reports

Arxiv

0+阅读 · 2023年4月7日

CoT-MAE v2: Contextual Masked Auto-Encoder with Multi-view Modeling for Passage Retrieval

Arxiv

0+阅读 · 2023年4月5日

The style transformer with common knowledge optimization for image-text retrieval

Arxiv

0+阅读 · 2023年4月3日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

Arxiv

19+阅读 · 2020年2月15日

VIP会员

相关主题

相关VIP内容

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

Transformer！「预训练变换器文本排序」首篇综述书，155页pdf概述BERT类模型文本检索进展

专知会员服务

69+阅读 · 2021年3月18日

【AAAI2021】以事件为中心的自然语言理解，256页ppt

【AAAI2021】以事件为中心的自然语言理解，256页ppt

专知会员服务

74+阅读 · 2021年2月8日

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

专知会员服务

110+阅读 · 2020年12月19日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

【港科大博士论文】高效迁移学习的低资源自然语言理解，164页pdf

专知

0+阅读 · 2022年8月24日

【KDD2022教程】Transformers多模态数据分类，41页ppt

【KDD2022教程】Transformers多模态数据分类，41页ppt

专知

0+阅读 · 2022年8月18日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

相关基金

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

通用Web结构化信息检索引擎的关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于图的大规模异质信息网络的匹配查询关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于语言理解的机器翻译方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

句子语义的视觉表示研究

国家自然科学基金

4+阅读 · 2009年12月31日

相关论文

RadTex: Learning Efficient Radiograph Representations from Text Reports

Arxiv

0+阅读 · 2023年4月7日

CoT-MAE v2: Contextual Masked Auto-Encoder with Multi-view Modeling for Passage Retrieval

Arxiv

0+阅读 · 2023年4月5日

The style transformer with common knowledge optimization for image-text retrieval

Arxiv

0+阅读 · 2023年4月3日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

Arxiv

19+阅读 · 2020年2月15日

微信扫码咨询专知VIP会员