【CCL 2019】ATT-第19期：预训练模型--自然语言处理的新范式（车万翔） - 专知VIP

会员服务 ·

11

BERT · 预训练语言模型 · 深度学习 · 词向量表示 · 自然语言处理 ·

2019 年 11 月 12 日

【CCL 2019】ATT-第19期：预训练模型--自然语言处理的新范式（车万翔）

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

报告主题： 预训练模型--自然语言处理的新范式

报告摘要： 传统的有监督自然语言处理模型依赖大规模的人工标注训练数据，这些数据标注代价非常高，因此规模有限，这也限制了自然语言处理系统进一步提升精度。以Word2vec，GloVe等为代表的词向量技术可以视为一种早期的预训练模型，从大规模未标注文本中预训练的词向量，在一定程度上提高了上层模型的精度。然而，这些模型假设“一个词由唯一的向量表示”，忽略了它们在不同上下文下的差异。以ELMo为代表的上下文相关词向量模型取消了以上的假设，在不同的上下文环境下，赋予相同的词以不同的词向量，因此又被称为“动态”词向量。BERT等模型进一步使用更深层的网络进行预训练，并使用了语言模型之外的预训练目标，在应用模式上也从简单的特征提取转换为精调整个网络结构。这些新的预训练模型在众多自然语言处理任务上取得了很好的效果，已成为自然语言处理的新范式。本报告首先介绍预训练模型的演化过程，接着介绍预训练模型在应用方面的最新研究进展，另外还列举了一些对预训练模型进行定性和定量分析的工作，最后对自然语言处理中预训练模型的发展趋势进行了展望。

邀请嘉宾： 车万翔博士，哈尔滨工业大学计算机学院教授，博士生导师，斯坦福大学访问学者，合作导师Christopher Manning教授。现任中国中文信息学会计算语言学专业委员会委员、青年工作委员会副主任；中国计算机学会高级会员、曾任 YOCSEF哈尔滨主席（2016-2017年度）。在ACL、EMNLP、AAAI、IJCAI等国内外高水平期刊和会议上发表学术论文50余篇，其中AAAI 2013年的文章获得了最佳论文提名奖，论文累计被引用2,100余次（Google Scholar数据），H-index值为26。出版教材 2 部，译著 2 部。承担国家自然科学基金、973等多项科研项目。负责研发的语言技术平台（LTP）已被600余家单位共享，提供的在线“语言云”服务已有用户1万余人，并授权给百度、腾讯、华为等公司使用。2018年，获CoNLL多语种句法分析国际评测第1名。2015-16年，连续两年获Google Focused Research Award（谷歌专注研究奖）；2016年，获黑龙江省科技进步一等奖（排名第2）；2012年，获黑龙江省技术发明奖二等奖（排名第2）；2010年获中国中文信息学会“钱伟长”中文信息处理科学技术奖一等奖（排名第2）、首届汉王青年创新奖（个人）等多项奖励。2017年，所主讲的《高级语言程序设计（Python）》课程获国家精品在线开放课程。

成为VIP会员查看完整内容

03.pdf

41

相关内容

BERT

BERT全称Bidirectional Encoder Representations from Transformers，是预训练语言表示的方法，可以在大型文本语料库（如维基百科）上训练通用的“语言理解”模型，然后将该模型用于下游NLP任务，比如机器翻译、问答。

【CCL 2019】机器翻译前沿综述，中国科学院计算技术研究所冯洋博士

【CCL 2019】机器翻译前沿综述，中国科学院计算技术研究所冯洋博士

专知会员服务

43+阅读 · 2019年11月12日

【CCL 2019】2019信息检索趋势，山东大学教授任昭春博士

【CCL 2019】2019信息检索趋势，山东大学教授任昭春博士

专知会员服务

30+阅读 · 2019年11月12日

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

专知会员服务

85+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：文本生成 |Text Generation: From the Perspective of Interactive Inference （张家俊）

【CCL 2019】ATT-第19期：文本生成 |Text Generation: From the Perspective of Interactive Inference （张家俊）

专知会员服务

43+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：Frontiers in Network Embedding and GCN （崔鹏）

【CCL 2019】ATT-第19期：Frontiers in Network Embedding and GCN （崔鹏）

专知会员服务

44+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

专知会员服务

50+阅读 · 2019年11月12日

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？，19页ppt

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？，19页ppt

专知会员服务

34+阅读 · 2019年11月5日

问答与对话-技术与系统之任务型对话系统【车万翔张伟男】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-技术与系统之任务型对话系统【车万翔张伟男】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

63+阅读 · 2019年10月23日

问答与对话-理论与基础之开放语义解析【韩先培、陈波】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-理论与基础之开放语义解析【韩先培、陈波】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

42+阅读 · 2019年10月23日

问答与对话-理论与基础之面向自然语言处理的深度学习基础【邱锡鹏】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-理论与基础之面向自然语言处理的深度学习基础【邱锡鹏】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

48+阅读 · 2019年10月21日

第十九届中国计算语言学大会（CCL 2020）征稿启事

第十九届中国计算语言学大会（CCL 2020）征稿启事

PaperWeekly

9+阅读 · 2020年3月2日

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？19页ppt

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？19页ppt

专知

17+阅读 · 2019年11月24日

分布式智能计算系统前沿

分布式智能计算系统前沿

中国计算机学会

19+阅读 · 2019年10月8日

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

专知

159+阅读 · 2019年9月8日

CCAI 2019｜视觉语音语言多模态论坛嘉宾介绍

CCAI 2019｜视觉语音语言多模态论坛嘉宾介绍

中国人工智能学会

12+阅读 · 2019年9月3日

哈工大讯飞联合实验室发布中文XLNet预训练模型

哈工大讯飞联合实验室发布中文XLNet预训练模型

哈工大SCIR

13+阅读 · 2019年8月20日

模式识别国家重点实验室自然语言处理研究组喜获中国中文信息学会多项大奖

模式识别国家重点实验室自然语言处理研究组喜获中国中文信息学会多项大奖

专知

4+阅读 · 2018年11月15日

哈工大刘挺教授：中文信息处理前沿技术进展

哈工大刘挺教授：中文信息处理前沿技术进展

哈工大SCIR

10+阅读 · 2018年11月8日

清华大学：刘洋——基于深度学习的机器翻译

清华大学：刘洋——基于深度学习的机器翻译

人工智能学家

12+阅读 · 2017年11月13日

大会 | 集结号吹响，国内NLP最高水平会议CCL/NLP-NABD下月南京召开！

大会 | 集结号吹响，国内NLP最高水平会议CCL/NLP-NABD下月南京召开！

AI科技评论

5+阅读 · 2017年9月27日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

Arxiv

7+阅读 · 2019年2月3日

Dialogue Natural Language Inference

Arxiv

7+阅读 · 2018年11月1日

Fast and Accurate, Convolutional Neural Network Based Approach for Object Detection from UAV

Fast and Accurate, Convolutional Neural Network Based Approach for Object Detection from UAV

Arxiv

6+阅读 · 2018年8月16日

Neural Baby Talk

Arxiv

6+阅读 · 2018年3月27日

A Survey on Dialogue Systems: Recent Advances and New Frontiers

Arxiv

11+阅读 · 2018年1月11日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

Deep Learning based Recommender System: A Survey and New Perspectives

Arxiv

6+阅读 · 2017年8月3日

VIP会员

相关主题

预训练语言模型

词向量表示

自然语言处理

相关VIP内容

【CCL 2019】机器翻译前沿综述，中国科学院计算技术研究所冯洋博士

【CCL 2019】机器翻译前沿综述，中国科学院计算技术研究所冯洋博士

专知会员服务

43+阅读 · 2019年11月12日

【CCL 2019】2019信息检索趋势，山东大学教授任昭春博士

【CCL 2019】2019信息检索趋势，山东大学教授任昭春博士

专知会员服务

30+阅读 · 2019年11月12日

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

专知会员服务

85+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：文本生成 |Text Generation: From the Perspective of Interactive Inference （张家俊）

【CCL 2019】ATT-第19期：文本生成 |Text Generation: From the Perspective of Interactive Inference （张家俊）

专知会员服务

43+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：Frontiers in Network Embedding and GCN （崔鹏）

【CCL 2019】ATT-第19期：Frontiers in Network Embedding and GCN （崔鹏）

专知会员服务

44+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

专知会员服务

50+阅读 · 2019年11月12日

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？，19页ppt

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？，19页ppt

专知会员服务

34+阅读 · 2019年11月5日

问答与对话-技术与系统之任务型对话系统【车万翔张伟男】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-技术与系统之任务型对话系统【车万翔张伟男】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

63+阅读 · 2019年10月23日

问答与对话-理论与基础之开放语义解析【韩先培、陈波】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-理论与基础之开放语义解析【韩先培、陈波】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

42+阅读 · 2019年10月23日

问答与对话-理论与基础之面向自然语言处理的深度学习基础【邱锡鹏】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-理论与基础之面向自然语言处理的深度学习基础【邱锡鹏】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

48+阅读 · 2019年10月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

《美陆军近战整合企业现代化计划（2025—2026）》最新报告

以色列-伊朗空战：短暂而激烈冲突的启示

《动态作战支援演习框架构建》80页

相关资讯

第十九届中国计算语言学大会（CCL 2020）征稿启事

第十九届中国计算语言学大会（CCL 2020）征稿启事

PaperWeekly

9+阅读 · 2020年3月2日

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？19页ppt

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？19页ppt

专知

17+阅读 · 2019年11月24日

分布式智能计算系统前沿

分布式智能计算系统前沿

中国计算机学会

19+阅读 · 2019年10月8日

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

专知

159+阅读 · 2019年9月8日

CCAI 2019｜视觉语音语言多模态论坛嘉宾介绍

CCAI 2019｜视觉语音语言多模态论坛嘉宾介绍

中国人工智能学会

12+阅读 · 2019年9月3日

哈工大讯飞联合实验室发布中文XLNet预训练模型

哈工大讯飞联合实验室发布中文XLNet预训练模型

哈工大SCIR

13+阅读 · 2019年8月20日

模式识别国家重点实验室自然语言处理研究组喜获中国中文信息学会多项大奖

模式识别国家重点实验室自然语言处理研究组喜获中国中文信息学会多项大奖

专知

4+阅读 · 2018年11月15日

哈工大刘挺教授：中文信息处理前沿技术进展

哈工大刘挺教授：中文信息处理前沿技术进展

哈工大SCIR

10+阅读 · 2018年11月8日

清华大学：刘洋——基于深度学习的机器翻译

清华大学：刘洋——基于深度学习的机器翻译

人工智能学家

12+阅读 · 2017年11月13日

大会 | 集结号吹响，国内NLP最高水平会议CCL/NLP-NABD下月南京召开！

大会 | 集结号吹响，国内NLP最高水平会议CCL/NLP-NABD下月南京召开！

AI科技评论

5+阅读 · 2017年9月27日

相关论文

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

Arxiv

7+阅读 · 2019年2月3日

Dialogue Natural Language Inference

Arxiv

7+阅读 · 2018年11月1日

Fast and Accurate, Convolutional Neural Network Based Approach for Object Detection from UAV

Fast and Accurate, Convolutional Neural Network Based Approach for Object Detection from UAV

Arxiv

6+阅读 · 2018年8月16日

Neural Baby Talk

Arxiv

6+阅读 · 2018年3月27日

A Survey on Dialogue Systems: Recent Advances and New Frontiers

Arxiv

11+阅读 · 2018年1月11日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

Deep Learning based Recommender System: A Survey and New Perspectives

Arxiv

6+阅读 · 2017年8月3日

微信扫码咨询专知VIP会员