多轮对话阅读理解新突破，追一科技登顶CoQA榜单 - 专知

会员服务 ·

0

多轮对话阅读理解新突破，追一科技登顶CoQA榜单

2019 年 9 月 12 日 高榕资本

近日，由斯坦福大学发起的对话式问答挑战赛 CoQA（Conversational Question Answering Challenge）中，追一科技 AI Lab团队超越微软团队成为榜单第一，刷新了之前微软等团队创造的CoQA纪录。值得注意的是，团队提交的技术方案中，单模型的各项指标表现首次全面超越人类。

榜单地址：https://stanfordnlp.github.io/coqa/

阅读理解是目前语言AI最受关注、进步最快的技术方向，全球有两大顶级比赛最受瞩目，分别是注重一问一答的SQuAD和多轮对话问答的CoQA。相比SQuAD，CoQA比赛重点挑战的是模型在对话过程中回答相互关联问题的能力，而且对话问答数据集由来自不同领域一系列文章中的对话问题组成，答案的形式非常自由，这些改进点都极大地提高了挑战赛的难度。

在此之前，包括微软、科大讯飞、搜狗等知名企业和院校，都曾经登顶榜单，其中微软在组合模型上，一度成为最佳记录保持者，引起业内瞩目。

追一科技团队在大规模预训练模型RoBERTa的基础上，融入了对抗训练（Adversarial training）和知识蒸馏（Knowledge Distillation）的思想，同时兼顾了CoQA数据集的自身特点，实验结果表明，上述方法显著地提升了系统表现。目前，团队在2019年9月5日提交的RoBERTa + AT + KD系统，在CoQA榜位列第一，其中单模型（single model）的表现首次全面超越人工评测指标。

此次登顶CoQA，也是追一科技持续耕耘AI技术的成果之一。作为以技术创新为核心驱动力的AI公司，追一科技一直专注在前沿AI语义交互与算法技术的攻坚，在意图识别、情感分析、知识图谱、阅读理解、多轮对话等领域不断取得突破。并获得了2018 CMRC机器阅读理解比赛冠军、2019年CCF语言与智能技术竞赛的“知识驱动对话”冠军。

除了技术突破，追一科技一直坚持研发与应用互相驱动，规模化落地AI应用。追一科技的智能产品和解决方案，已经在金融、运营商、政企、泛互联网等众多领域落地，服务300多家行业标杆客户。与此同时，追一科技还致力于创新型技术的应用落地、量产及标准化，例如，阅读理解、多模态交互数字人等技术和产品，已经在部分券商、银行伙伴场景中应用，实现业内突破。

随着NLP等AI技术的突破，产业智能化时代的到来，多行业场景化需求将对技术创新和产品化能力提出更多挑战。追一科技将继续专注创新能力，攻坚技术前沿，以技术创新赋能更多行业伙伴！

追一科技完成C轮4100万美元融资，助力产业智能化升级

依图再夺世界级冠军，这次是“声纹识别”！

榕报·8月 | 依图承建视觉计算国家新一代AI开放创新平台，拼多多、虎牙等发布Q2财报...

登录查看更多

7

相关内容

多轮对话

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答

【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答

专知会员服务

83+阅读 · 2019年12月14日

【阿里技术干货】知识结构化在阿里小蜜中的应用

【阿里技术干货】知识结构化在阿里小蜜中的应用

专知会员服务

98+阅读 · 2019年12月14日

2019中国硬科技发展白皮书 193页

2019中国硬科技发展白皮书 193页

专知会员服务

86+阅读 · 2019年12月13日

【大数据白皮书 2019】中国信息通信研究院

【大数据白皮书 2019】中国信息通信研究院

专知会员服务

138+阅读 · 2019年12月12日

【NLP| 推荐文章】基于知识库的问答系统关键技术综述（Core techniques of question answering systems over knowledge bases：a survey）

专知会员服务

47+阅读 · 2019年11月24日

【NLP| 推荐文章】神经阅读理解与超越（Neural Reading Comprehension And Beyond）

【NLP| 推荐文章】神经阅读理解与超越（Neural Reading Comprehension And Beyond）

专知会员服务

26+阅读 · 2019年11月23日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

65+阅读 · 2019年10月27日

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

专知会员服务

47+阅读 · 2019年10月23日

FlowQA: Grasping Flow in History for Conversational Machine Comprehension

FlowQA: Grasping Flow in History for Conversational Machine Comprehension

专知会员服务

34+阅读 · 2019年10月18日

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软丹棱街5号

19+阅读 · 2019年5月14日

微软机器阅读理解系统性能升级，刷新CoQA对话式问答挑战赛纪录

微软机器阅读理解系统性能升级，刷新CoQA对话式问答挑战赛纪录

微软研究院AI头条

4+阅读 · 2019年5月6日

AI会话能力超越人类！CoQA挑战赛微软创新纪录

AI会话能力超越人类！CoQA挑战赛微软创新纪录

智东西

12+阅读 · 2019年5月5日

媲美人类对话水平！微软最新NLP模型3项评分全面超越人类水平！

媲美人类对话水平！微软最新NLP模型3项评分全面超越人类水平！

机器学习算法与Python学习

8+阅读 · 2019年5月4日

微软机器阅读理解超越人类水平，CoQA数据集得分刷新记录

微软机器阅读理解超越人类水平，CoQA数据集得分刷新记录

机器之心

5+阅读 · 2019年5月4日

再破新纪录！微软最新NLP模型3项评分全面超越人类水平！

再破新纪录！微软最新NLP模型3项评分全面超越人类水平！

新智元

8+阅读 · 2019年5月4日

中国AI军团争霸机器阅读理解大赛，搜狗创下全球新纪录

中国AI军团争霸机器阅读理解大赛，搜狗创下全球新纪录

THU数据派

5+阅读 · 2019年1月18日

哈工大讯飞联合实验室在机器阅读理解评测SQuAD 2.0中荣登榜首

哈工大讯飞联合实验室在机器阅读理解评测SQuAD 2.0中荣登榜首

哈工大SCIR

5+阅读 · 2018年11月22日

CoQA！斯坦福召开新一轮QA比赛，剑指对话问答！

CoQA！斯坦福召开新一轮QA比赛，剑指对话问答！

专知

6+阅读 · 2018年8月23日

业界 | 百度提出机器阅读理解技术V-NET，登顶MS MARCO数据集榜单

业界 | 百度提出机器阅读理解技术V-NET，登顶MS MARCO数据集榜单

机器之心

6+阅读 · 2018年2月22日

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

Arxiv

23+阅读 · 2019年12月12日

Towards Building a Multilingual Sememe Knowledge Base: Predicting Sememes for BabelNet Synsets

Arxiv

15+阅读 · 2019年12月4日

HCqa: Hybrid and Complex Question Answering on Textual Corpus and Knowledge Graph

Arxiv

3+阅读 · 2019年1月28日

Knowledge Based Machine Reading Comprehension

Knowledge Based Machine Reading Comprehension

Arxiv

4+阅读 · 2018年9月12日

CoQA: A Conversational Question Answering Challenge

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

QuAC : Question Answering in Context

QuAC : Question Answering in Context

Arxiv

4+阅读 · 2018年8月21日

Reinforced Mnemonic Reader for Machine Reading Comprehension

Arxiv

10+阅读 · 2018年4月25日

QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension

Arxiv

4+阅读 · 2018年4月23日

Phrase-Indexed Question Answering: A New Challenge for Scalable Document Comprehension

Arxiv

3+阅读 · 2018年4月20日

DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications

Arxiv

4+阅读 · 2017年11月15日

VIP会员

相关主题

机器阅读理解

斯坦福大学 (Stanford University)

相关VIP内容

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类

专知会员服务

24+阅读 · 2020年4月7日

【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答

【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答

专知会员服务

83+阅读 · 2019年12月14日

【阿里技术干货】知识结构化在阿里小蜜中的应用

【阿里技术干货】知识结构化在阿里小蜜中的应用

专知会员服务

98+阅读 · 2019年12月14日

2019中国硬科技发展白皮书 193页

2019中国硬科技发展白皮书 193页

专知会员服务

86+阅读 · 2019年12月13日

【大数据白皮书 2019】中国信息通信研究院

【大数据白皮书 2019】中国信息通信研究院

专知会员服务

138+阅读 · 2019年12月12日

【NLP| 推荐文章】基于知识库的问答系统关键技术综述（Core techniques of question answering systems over knowledge bases：a survey）

专知会员服务

47+阅读 · 2019年11月24日

【NLP| 推荐文章】神经阅读理解与超越（Neural Reading Comprehension And Beyond）

【NLP| 推荐文章】神经阅读理解与超越（Neural Reading Comprehension And Beyond）

专知会员服务

26+阅读 · 2019年11月23日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

65+阅读 · 2019年10月27日

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

专知会员服务

47+阅读 · 2019年10月23日

FlowQA: Grasping Flow in History for Conversational Machine Comprehension

FlowQA: Grasping Flow in History for Conversational Machine Comprehension

专知会员服务

34+阅读 · 2019年10月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

多模态大语言模型下游调优中“保持自我”的重要性

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

相关资讯

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软丹棱街5号

19+阅读 · 2019年5月14日

微软机器阅读理解系统性能升级，刷新CoQA对话式问答挑战赛纪录

微软机器阅读理解系统性能升级，刷新CoQA对话式问答挑战赛纪录

微软研究院AI头条

4+阅读 · 2019年5月6日

AI会话能力超越人类！CoQA挑战赛微软创新纪录

AI会话能力超越人类！CoQA挑战赛微软创新纪录

智东西

12+阅读 · 2019年5月5日

媲美人类对话水平！微软最新NLP模型3项评分全面超越人类水平！

媲美人类对话水平！微软最新NLP模型3项评分全面超越人类水平！

机器学习算法与Python学习

8+阅读 · 2019年5月4日

微软机器阅读理解超越人类水平，CoQA数据集得分刷新记录

微软机器阅读理解超越人类水平，CoQA数据集得分刷新记录

机器之心

5+阅读 · 2019年5月4日

再破新纪录！微软最新NLP模型3项评分全面超越人类水平！

再破新纪录！微软最新NLP模型3项评分全面超越人类水平！

新智元

8+阅读 · 2019年5月4日

中国AI军团争霸机器阅读理解大赛，搜狗创下全球新纪录

中国AI军团争霸机器阅读理解大赛，搜狗创下全球新纪录

THU数据派

5+阅读 · 2019年1月18日

哈工大讯飞联合实验室在机器阅读理解评测SQuAD 2.0中荣登榜首

哈工大讯飞联合实验室在机器阅读理解评测SQuAD 2.0中荣登榜首

哈工大SCIR

5+阅读 · 2018年11月22日

CoQA！斯坦福召开新一轮QA比赛，剑指对话问答！

CoQA！斯坦福召开新一轮QA比赛，剑指对话问答！

专知

6+阅读 · 2018年8月23日

业界 | 百度提出机器阅读理解技术V-NET，登顶MS MARCO数据集榜单

业界 | 百度提出机器阅读理解技术V-NET，登顶MS MARCO数据集榜单

机器之心

6+阅读 · 2018年2月22日

相关论文

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service

Arxiv

23+阅读 · 2019年12月12日

Towards Building a Multilingual Sememe Knowledge Base: Predicting Sememes for BabelNet Synsets

Arxiv

15+阅读 · 2019年12月4日

HCqa: Hybrid and Complex Question Answering on Textual Corpus and Knowledge Graph

Arxiv

3+阅读 · 2019年1月28日

Knowledge Based Machine Reading Comprehension

Knowledge Based Machine Reading Comprehension

Arxiv

4+阅读 · 2018年9月12日

CoQA: A Conversational Question Answering Challenge

CoQA: A Conversational Question Answering Challenge

Arxiv

7+阅读 · 2018年8月21日

QuAC : Question Answering in Context

QuAC : Question Answering in Context

Arxiv

4+阅读 · 2018年8月21日

Reinforced Mnemonic Reader for Machine Reading Comprehension

Arxiv

10+阅读 · 2018年4月25日

QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension

Arxiv

4+阅读 · 2018年4月23日

Phrase-Indexed Question Answering: A New Challenge for Scalable Document Comprehension

Arxiv

3+阅读 · 2018年4月20日

DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications

Arxiv

4+阅读 · 2017年11月15日

大家都在搜

蓝牙安全攻防

大型语言模型

朱克爱德华兹家族

模型压缩 | 知识蒸馏经典解读

微信扫码咨询专知VIP会员