会员服务 ·

0

机器推理系列文章概览：七大NLP任务最新方法与进展

2019 年 9 月 15 日 AI100

作者 | 段楠，唐都钰，周明

来源 | 微软研究院AI头条（ID: MSRAsia）

导读：自然语言处理的发展进化带来了新的热潮与研究问题，研究者们在许多不同的任务中推动机器推理（Machine Reasoning）能力的提升。基于一系列领先的科研成果，微软亚洲研究院自然语言计算组将陆续推出一组文章，介绍机器推理在常识问答、事实检测、自然语言推理、视觉常识推理、视觉问答、文档级问答、多轮语义分析和问答等任务上的最新方法和进展。

从规则方法、统计方法到目前的深度学习方法，自然语言处理（NLP）研究一直处于不断发展和进化的状态之中，并在过去五年取得了令人瞩目的成果。对于一个拥有充分标注语料的 NLP 任务（例如机器翻译和自动问答），现有的深度学习方法能够很好地对输入和输出之间的关系进行建模，并在分布相同或类似的测试数据上取得令人满意的效果。

然而，一旦测试数据所涉及的知识和领域超出训练数据的范畴之外，大多数模型的效果都会一落千丈。这一现象其实不难理解：人类在从小到大的成长过程中，已经通过各式各样的学习过程掌握了大量的通用知识（例如数学知识、物理知识、世界知识、常识知识等）。这些知识能够帮助人类在学习新技能或遇到新问题时进行推理并举一反三。然而，绝大多数 NLP 模型都不具备这样的知识模型，因此就不能很好地理解和解决新的问题。

大规模知识图谱（例如 Satori 和 WikiData ）的出现使得构建基于知识的 NLP 模型成为可能，语义分析（Semantic Parsing）和知识图谱问答（Knowledge-based QA）研究也藉此成为最热门的两个 NLP 课题。然而，由于现有知识图谱对人类知识的覆盖度依然非常有限，基于知识图谱的 NLP 模型只能精准理解和处理很少一部分自然语言问题和任务，而对剩余部分无能为力。

最近两年，预训练模型（例如GPT、BERT和XLNet）的出现极大地提高了几乎所有自然语言处理任务的最优水平。通过在海量文本上进行基于语言模型的预训练以及在下游任务上对模型参数进行微调，预训练模型能够很好地将从训练数据中学习到的“通用知识”迁移和传递到下游任务中。关于这种“通用领域预训练+特定任务微调”的新范式，整个 NLP 社区也展开了热烈的讨论：预训练模型是否真的学到了 “知识”？它是否能够替代已有的符号化知识图谱？它是否具备推理能力？

带着对上述若干问题的好奇，微软亚洲研究院自然语言计算组的研究员开展了一系列关于机器推理的研究。作为引言，本文将对什么是机器推理给出解释，并简要说明已有 NLP 方法与机器推理的关系。接下来，我们会陆续推出一系列文章，介绍机器推理在常识问答、事实检测、自然语言推理、视觉常识推理、视觉问答、文档级问答、多轮语义分析和问答等任务上的最新方法和进展。

机器推理（Machine Reasoning），是指基于已有知识对未见问题进行理解和推断，并得出问题对应答案的过程[1]。根据该定义，机器推理涉及4个主要问题：（1）如何对输入进行理解和表示？（2）如何定义知识？（3）如何抽取和表示与输入相关的知识？（4）基于对输入及其相关知识的理解，如何推断出输入对应的输出？下图给出机器推理的整体框架。

图1：机器推理整体框架

对于输入的理解和表示，NLP 领域已经积累了大量的研究，包括词袋（Bag-of-Word）模型、句法分析（Syntactic Parsing）模型、词嵌入（Word Embedding）模型和句子嵌入（Sentence Embedding）模型等。对于知识的定义，不仅开放/特定领域的知识图谱和常识图谱属于“知识”的范畴，目前被广泛研究和使用的预训练模型同样可以看做是知识。这是因为预训练模型的本质就是将每个单词在海量文本中的上下文存储在模型当中。

Facebook 的工作[2]也从实验角度证明了现有预训练模型对知识图谱和常识知识的覆盖。对于知识的提取和表示，基于知识图谱的模型通常基于实体链接的结果从知识图谱中找到与输入相关的知识，并采用知识嵌入（Knowledge Embedding）的方式对其进行编码和建模。相比之下，基于预训练模型的知识提取则对应了使用预训练模型对输入文本进行编码的过程。对于基于输入及其相关知识进行推断，不同的任务通常采用不同的推断算法。例如，在语义分析任务中，推断过程对应了生成语义表示的算法。在基于预训练模型的微调方法中，推断过程对应了已有预训练模型之上的任务相关层。

上述描述只是对机器推理的一个粗浅解释。在接下来的一系列文章中，我们将分别介绍上述机器推理框架在若干最新推理任务上的具体实现方法和实验效果，包括：

机器推理系列之一：基于推理的常识问答

图2：我们提出的推理方法（XLNet+Graph Reasoning）在以色列特拉维夫大学常识问答任务 CommonsenseQA上取得了目前 state-of-the-art 的结果[3]。

（https://www.tau-nlp.org/csqa-leaderboard）

机器推理系列之二：基于推理的事实检测

图3：我们提出的推理方法（DREAM）在 Amazon 剑桥研究院事实检测任务FEVER上取得了目前 state-of-the-art 的结果[4]。

（https://competitions.codalab.org/competitions/18814#results）

机器推理系列之三：基于推理的跨语言自然语言推理

图4：我们提出的跨语言预训练模型（Unicoder）在纽约大学跨语言自然语言推理任务XNLI上取得了目前 state-of-the-art 的结果[5]。

（https://arxiv.org/pdf/1909.00964.pdf）

机器推理系列之四：基于推理的视觉常识推理

图5：我们提出的跨模态预训练模型（Unicoder-VL）在华盛顿大学视觉常识推理任务 VCR 上取得了目前 state-of-the-art 的结果[6]。

（https://visualcommonsense.com/leaderboard/）

机器推理系列之五：基于推理的视觉问答

图6：我们提出的推理方法（DREAM+Unicoder-VL）在斯坦福大学视觉推理和问答任务 GQA 上取得了目前 state-of-the-art 的结果[7]。

（https://evalai.cloudcv.org/web/challenges/challenge-page/225/leaderboard/733）

机器推理系列之六：基于推理的文档级问答

图7：我们提出的基于BERT的文档建模方法（BERT-DM）在谷歌文档级问答任务 NQ 上取得了目前 state-of-the-art 的结果[8]。

（https://ai.google.com/research/NaturalQuestions）

机器推理系列之七：基于推理的多轮语义分析和问答

图8：我们提出的多轮语义分析和问答方法（Seq2Action）在IBM研究院多轮复杂问答任务 CSQA 上取得了目前 state-of-the-art 的结果[9][10]。

参考文献：

[1] Ming Zhou, Nan Duan, Shujie Liu, Heung-Yeung Shum. Progress in Neural NLP: Modeling, Learning and Reasoning. To appear in Engineering, 2019.

[2] Fabio Petroni, Tim Rocktaschel, Patrick Lewis, Anton Bakhtin, Yuxiang Wu, Alexander H. Miller, Sebastian Riedel. Language Models as Knowledge Bases?. EMNLP, 2019.

[3] Shangwen Lv, Daya Guo, Jingjing Xu, Duyu Tang, Nan Duan, Ming Gong, Linjun Shou, Daxin Jiang, Guihong Cao, Songlin Hu. Graph-based Reasoning over Heterogeneous External Knowledge for Commonsense Question Answering. To appear in arXiv, 2019.

[4] Wanjun Zhong, Jingjing Xu, Duyu Tang, Zenan Xu, Nan Duan, Ming Zhou, Jiahai Wang, Jian Yin. Reasoning Over Semantic-Level Graph for Fact Checking. To appear in arXiv, 2019.

[5] Haoyang Huang, Yaobo Liang, Nan Duan, Ming Gong, Linjun Shou, Daxin Jiang, Ming Zhou. Unicoder: A Universal Language Encoder by Pre-training with Multiple Cross-lingual Tasks. EMNLP, 2019.

[6] Gen Li, Nan Duan, Yuejian Fang, Ming Gong, Daxin Jiang, Ming Zhou. Unicoder-VL: A Universal Encoder for Vision and Language by Cross-modal Pre-training. arXiv, 2019.

[7] Chenfei Wu, Nan Duan, Gen Li, Yanzhao Zhou, Duyu Tang, Xiaojie Wang, Daxin Jiang, Ming Zhou. DREAM: Dynamic REAsoning Machine for Visual Question Answering. To appear in arXiv, 2019.

[8] Bo Zheng, Haoyang Wen, Yaobo Liang, Nan Duan, Wanxiang Che, Daxin Jiang, Ting Liu, Ming Zhou. Document Modeling with Graph Attention Networks for Multi-grained Machine Reading Comprehension. To appear in arXiv, 2019.

[9] Daya Guo, Duyu Tang, Nan Duan, Jian Yin, Ming Zhou. Dialog-to-Action: Conversational Question Answering over a Large-Scale Knowledge Base. NeurIPS, 2018.

[10] Daya Guo, Duyu Tang, Nan Duan, Ming Zhou, Jian Yin. Coupling Retrieval and Meta-Learning for Context-Dependent Semantic Parsing. ACL, 2019.

(本文为AI科技大本营转载文章，转载请联系作者*)

◆

精彩推荐

◆

倒计时！由易观携手CSDN联合主办的第三届易观算法大赛还剩5天，冠军团队将获得3万元！

本次比赛主要预测访问平台的相关事件的PV,UV流量（包括Web端，移动端等），大赛将会提供相应事件的流量数据，以及对应时间段内的所有事件明细表和用户属性表等数据，进行模型训练，并用训练好的模型预测规定日期范围内的事件流量。

推荐阅读

知乎算法团队负责人孙付伟：Graph Embedding在知乎的应用实践

大数据工程师手册：全面系统的掌握必备知识与工具

经典再读 | NASNet：神经架构搜索网络在图像分类中的表现

激光雷达，马斯克看不上，却又无可替代？

卷积神经网络中十大拍案叫绝的操作

Docker是啥？容器变革的火花？

5大必知的图算法，附Python代码实现

阿里云弹性计算负责人蒋林泉：亿级场景驱动的技术自研之路 | 问底中国 IT 技术演变

你点的每个“在看”，我都认真当成了喜欢

登录查看更多

12

相关内容

机器推理

最新《多任务学习》综述，39页pdf

最新《多任务学习》综述，39页pdf

专知会员服务

266+阅读 · 2020年7月10日

多模态学习方法综述

专知会员服务

235+阅读 · 2020年5月6日

【北航】面向自然语言处理的预训练技术研究综述

【北航】面向自然语言处理的预训练技术研究综述

专知会员服务

114+阅读 · 2020年4月23日

【综述】面向视觉智能的知识蒸馏和Student-Teacher方法，附37页pdf下载

【综述】面向视觉智能的知识蒸馏和Student-Teacher方法，附37页pdf下载

专知会员服务

68+阅读 · 2020年4月16日

【论文翻译】2020最新预训练语言模型综述：Pre-trained Models for Natural Language Processing: A Survey

【论文翻译】2020最新预训练语言模型综述：Pre-trained Models for Natural Language Processing: A Survey

专知会员服务

94+阅读 · 2020年4月13日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

机器翻译深度学习最新综述

机器翻译深度学习最新综述

专知会员服务

99+阅读 · 2020年2月20日

深度学习自然语言处理综述，266篇参考文献

深度学习自然语言处理综述，266篇参考文献

专知会员服务

231+阅读 · 2019年10月12日

[综述]基于深度学习的开放领域对话系统研究综述

[综述]基于深度学习的开放领域对话系统研究综述

专知会员服务

80+阅读 · 2019年10月12日

机器推理系列第二弹：机器推理在事实检测任务中的应用

机器推理系列第二弹：机器推理在事实检测任务中的应用

AINLP

5+阅读 · 2019年9月25日

机器推理系列第一弹：机器推理在常识问答任务中的应用

机器推理系列第一弹：机器推理在常识问答任务中的应用

AINLP

6+阅读 · 2019年9月19日

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

雷锋网

5+阅读 · 2019年6月20日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE（附项目地址）

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE（附项目地址）

数据派THU

24+阅读 · 2019年3月23日

一文了解自然语言处理神经史

一文了解自然语言处理神经史

云栖社区

11+阅读 · 2018年12月2日

问答系统冠军之路：用CNN做问答任务的QANet

问答系统冠军之路：用CNN做问答任务的QANet

AI科技评论

18+阅读 · 2018年5月11日

Natural 自然语言处理（NLP）「全解析」

Natural 自然语言处理（NLP）「全解析」

人工智能学家

14+阅读 · 2017年9月23日

Train Large, Then Compress: Rethinking Model Size for Efficient Training and Inference of Transformers

Arxiv

12+阅读 · 2020年6月23日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

Arxiv

19+阅读 · 2020年2月15日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

BAM! Born-Again Multi-Task Networks for Natural Language Understanding

BAM! Born-Again Multi-Task Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年7月10日

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

Arxiv

7+阅读 · 2019年2月3日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

15+阅读 · 2018年10月11日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Inference in Probabilistic Graphical Models by Graph Neural Networks

Arxiv

3+阅读 · 2018年5月25日

VIP会员

相关主题

预训练模型

视觉常识推理

相关VIP内容

最新《多任务学习》综述，39页pdf

最新《多任务学习》综述，39页pdf

专知会员服务

266+阅读 · 2020年7月10日

多模态学习方法综述

专知会员服务

235+阅读 · 2020年5月6日

【北航】面向自然语言处理的预训练技术研究综述

【北航】面向自然语言处理的预训练技术研究综述

专知会员服务

114+阅读 · 2020年4月23日

【综述】面向视觉智能的知识蒸馏和Student-Teacher方法，附37页pdf下载

【综述】面向视觉智能的知识蒸馏和Student-Teacher方法，附37页pdf下载

专知会员服务

68+阅读 · 2020年4月16日

【论文翻译】2020最新预训练语言模型综述：Pre-trained Models for Natural Language Processing: A Survey

【论文翻译】2020最新预训练语言模型综述：Pre-trained Models for Natural Language Processing: A Survey

专知会员服务

94+阅读 · 2020年4月13日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

机器翻译深度学习最新综述

机器翻译深度学习最新综述

专知会员服务

99+阅读 · 2020年2月20日

深度学习自然语言处理综述，266篇参考文献

深度学习自然语言处理综述，266篇参考文献

专知会员服务

231+阅读 · 2019年10月12日

[综述]基于深度学习的开放领域对话系统研究综述

[综述]基于深度学习的开放领域对话系统研究综述

专知会员服务

80+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】多目标奖励与偏好优化：理论与算法

《无形的防御者？将定向能武器集成到反无人机框架的机遇与挑战》报告

自主化海军：海上无人系统与未来海战

迈向智能体系统规模化的科学

相关资讯

机器推理系列第二弹：机器推理在事实检测任务中的应用

机器推理系列第二弹：机器推理在事实检测任务中的应用

AINLP

5+阅读 · 2019年9月25日

机器推理系列第一弹：机器推理在常识问答任务中的应用

机器推理系列第一弹：机器推理在常识问答任务中的应用

AINLP

6+阅读 · 2019年9月19日

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

谷歌更强 NLP 模型 XLNet 开源：20 项任务全面碾压 BERT！

雷锋网

5+阅读 · 2019年6月20日

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

开发 | 谷歌更强NLP模型XLNet开源：20项任务全面碾压BERT！

AI科技评论

6+阅读 · 2019年6月20日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE（附项目地址）

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE（附项目地址）

数据派THU

24+阅读 · 2019年3月23日

一文了解自然语言处理神经史

一文了解自然语言处理神经史

云栖社区

11+阅读 · 2018年12月2日

问答系统冠军之路：用CNN做问答任务的QANet

问答系统冠军之路：用CNN做问答任务的QANet

AI科技评论

18+阅读 · 2018年5月11日

Natural 自然语言处理（NLP）「全解析」

Natural 自然语言处理（NLP）「全解析」

人工智能学家

14+阅读 · 2017年9月23日

相关论文

Train Large, Then Compress: Rethinking Model Size for Efficient Training and Inference of Transformers

Arxiv

12+阅读 · 2020年6月23日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

UniViLM: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation

Arxiv

19+阅读 · 2020年2月15日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

BAM! Born-Again Multi-Task Networks for Natural Language Understanding

BAM! Born-Again Multi-Task Networks for Natural Language Understanding

Arxiv

3+阅读 · 2019年7月10日

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

BioBERT: a pre-trained biomedical language representation model for biomedical text mining

Arxiv

7+阅读 · 2019年2月3日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

15+阅读 · 2018年10月11日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Inference in Probabilistic Graphical Models by Graph Neural Networks

Arxiv

3+阅读 · 2018年5月25日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

滴滴司机调度系统实践

微信扫码咨询专知VIP会员