【斯坦福CS224N硬核课】如何融合知识到语言模型中，60页ppt - 专知VIP

会员服务 ·

1

语言模型 · 自然语言处理 ·

2021 年 3 月 8 日

【斯坦福CS224N硬核课】如何融合知识到语言模型中，60页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

以ELMO (Peters et al.， 2018)、GPT (Radford et al.， 2018)和BERT (Devlin et al.， 2019)为代表的预训练语言模型受到了广泛关注，并提出了大量的变体模型。在这些研究中，一些研究人员致力于将知识引入语言模型(Levine et al., 2019; Lauscher et al., 2019; Liu et al., 2019; Zhang et al., 2019b)。ERNIE-Baidu (Sun et al.， 2019)引入新的掩蔽单元，如短语和实体，在这些掩蔽单元中学习知识信息。作为奖励，来自短语和实体的语法和语义信息被隐式地集成到语言模型中。此外，ERNIE-Tsinghua (Zhang et al.， 2019a)探索了一种不同的知识信息，将知识图谱整合到BERT中，同时学习词汇、句法和知识信息。Xiong et al. (2019) 将实体替换检查任务引入到预先训练的语言模型中，并改进若干与实体相关的下游任务，如问答和实体类型。Wang et al.(2020)提出了一种将知识注入语言模型的插件方式，他们的方法将不同种类的知识保存在不同的适配器中。这些方法所引入的知识信息并没有很重视KG中图表化的知识。

http://web.stanford.edu/class/cs224n/index.html#schedule

成为VIP会员查看完整内容

61

相关内容

语言模型

CS224N来了！斯坦福经典《自然语言处理》2021课程开讲！Manning、陈丹琦讲座

CS224N来了！斯坦福经典《自然语言处理》2021课程开讲！Manning、陈丹琦讲座

专知会员服务

69+阅读 · 2021年11月5日

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

专知会员服务

74+阅读 · 2021年2月23日

【斯坦福CS224N硬核课】自然语言生成NLG，79页ppt

专知会员服务

37+阅读 · 2021年2月22日

【斯坦福CS224W】知识图谱推理，84页ppt

【斯坦福CS224W】知识图谱推理，84页ppt

专知会员服务

121+阅读 · 2021年2月19日

【斯坦福CS224W】知识图谱嵌入，77页ppt

专知会员服务

67+阅读 · 2021年2月17日

【斯坦福CS224N硬核课】Transformers模型详解，50页ppt

专知会员服务

61+阅读 · 2021年2月16日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【ST2020硬核课】深度神经网络，57页ppt

【ST2020硬核课】深度神经网络，57页ppt

专知会员服务

48+阅读 · 2020年8月19日

【ST2020硬核课】深度学习即统计学习，50页ppt

【ST2020硬核课】深度学习即统计学习，50页ppt

专知会员服务

67+阅读 · 2020年8月17日

NLPCC 2020《预训练语言模型回顾》讲义下载，156页PPT

NLPCC 2020《预训练语言模型回顾》讲义下载，156页PPT

专知

5+阅读 · 2020年10月17日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知

6+阅读 · 2020年6月25日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

只知道CS224N？斯坦福最新推出NLU公开课CS224U

只知道CS224N？斯坦福最新推出NLU公开课CS224U

机器之心

3+阅读 · 2019年6月20日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

CS224N 2019最全20视频分享：斯坦福大学深度学习自然语言处理课程资源索引

CS224N 2019最全20视频分享：斯坦福大学深度学习自然语言处理课程资源索引

AINLP

12+阅读 · 2019年4月21日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

(2019)斯坦福CS224n深度学习自然语言处理课程(已开放Slides)

(2019)斯坦福CS224n深度学习自然语言处理课程(已开放Slides)

专知

15+阅读 · 2019年3月15日

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

专知

12+阅读 · 2019年1月6日

深度上下文词向量

深度上下文词向量

微信AI

27+阅读 · 2018年9月13日

A Dynamic Architecture for Task Assignment and Scheduling for Collaborative Robotic Cells

A Dynamic Architecture for Task Assignment and Scheduling for Collaborative Robotic Cells

Arxiv

0+阅读 · 2021年4月29日

Capability Iteration Network for Robot Path Planning

Arxiv

0+阅读 · 2021年4月29日

Investigating Perceptions of Social Intelligence in Simulated Human-Chatbot Interactions

Arxiv

0+阅读 · 2021年4月28日

Actionable Models: Unsupervised Offline Reinforcement Learning of Robotic Skills

Arxiv

0+阅读 · 2021年4月28日

Advanced Semantics for Commonsense Knowledge Extraction

Arxiv

6+阅读 · 2021年2月12日

Language Models as Knowledge Bases?

Arxiv

6+阅读 · 2019年9月4日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

5+阅读 · 2018年10月5日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

VIP会员

相关主题

自然语言处理

相关VIP内容

CS224N来了！斯坦福经典《自然语言处理》2021课程开讲！Manning、陈丹琦讲座

CS224N来了！斯坦福经典《自然语言处理》2021课程开讲！Manning、陈丹琦讲座

专知会员服务

69+阅读 · 2021年11月5日

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

专知会员服务

74+阅读 · 2021年2月23日

【斯坦福CS224N硬核课】自然语言生成NLG，79页ppt

专知会员服务

37+阅读 · 2021年2月22日

【斯坦福CS224W】知识图谱推理，84页ppt

【斯坦福CS224W】知识图谱推理，84页ppt

专知会员服务

121+阅读 · 2021年2月19日

【斯坦福CS224W】知识图谱嵌入，77页ppt

专知会员服务

67+阅读 · 2021年2月17日

【斯坦福CS224N硬核课】Transformers模型详解，50页ppt

专知会员服务

61+阅读 · 2021年2月16日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【ST2020硬核课】深度神经网络，57页ppt

【ST2020硬核课】深度神经网络，57页ppt

专知会员服务

48+阅读 · 2020年8月19日

【ST2020硬核课】深度学习即统计学习，50页ppt

【ST2020硬核课】深度学习即统计学习，50页ppt

专知会员服务

67+阅读 · 2020年8月17日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

NLPCC 2020《预训练语言模型回顾》讲义下载，156页PPT

NLPCC 2020《预训练语言模型回顾》讲义下载，156页PPT

专知

5+阅读 · 2020年10月17日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知

6+阅读 · 2020年6月25日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

只知道CS224N？斯坦福最新推出NLU公开课CS224U

只知道CS224N？斯坦福最新推出NLU公开课CS224U

机器之心

3+阅读 · 2019年6月20日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

CS224N 2019最全20视频分享：斯坦福大学深度学习自然语言处理课程资源索引

CS224N 2019最全20视频分享：斯坦福大学深度学习自然语言处理课程资源索引

AINLP

12+阅读 · 2019年4月21日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

(2019)斯坦福CS224n深度学习自然语言处理课程(已开放Slides)

(2019)斯坦福CS224n深度学习自然语言处理课程(已开放Slides)

专知

15+阅读 · 2019年3月15日

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

斯坦福2019《CS224n:自然语言处理深度学习》开课，Christopher Manning带队授课

专知

12+阅读 · 2019年1月6日

深度上下文词向量

深度上下文词向量

微信AI

27+阅读 · 2018年9月13日

相关论文

A Dynamic Architecture for Task Assignment and Scheduling for Collaborative Robotic Cells

A Dynamic Architecture for Task Assignment and Scheduling for Collaborative Robotic Cells

Arxiv

0+阅读 · 2021年4月29日

Capability Iteration Network for Robot Path Planning

Arxiv

0+阅读 · 2021年4月29日

Investigating Perceptions of Social Intelligence in Simulated Human-Chatbot Interactions

Arxiv

0+阅读 · 2021年4月28日

Actionable Models: Unsupervised Offline Reinforcement Learning of Robotic Skills

Arxiv

0+阅读 · 2021年4月28日

Advanced Semantics for Commonsense Knowledge Extraction

Arxiv

6+阅读 · 2021年2月12日

Language Models as Knowledge Bases?

Arxiv

6+阅读 · 2019年9月4日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Multi-Task Deep Neural Networks for Natural Language Understanding

Multi-Task Deep Neural Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年1月31日

Improving Question Answering by Commonsense-Based Pre-Training

Arxiv

5+阅读 · 2018年10月5日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

微信扫码咨询专知VIP会员