多轮对话阅读理解新突破,追一科技登顶CoQA榜单

2019 年 9 月 12 日 高榕资本

近日,由斯坦福大学发起的对话式问答挑战赛 CoQA(Conversational Question Answering Challenge中,追一科技 AI Lab团队超越微软团队成为榜单第一,刷新了之前微软等团队创造的CoQA纪录。值得注意的是,团队提交的技术方案中,单模型的各项指标表现首次全面超越人类。


榜单地址:https://stanfordnlp.github.io/coqa/



阅读理解是目前语言AI最受关注、进步最快的技术方向,全球有两大顶级比赛最受瞩目,分别是注重一问一答的SQuAD和多轮对话问答的CoQA。相比SQuAD,CoQA比赛重点挑战的是模型在对话过程中回答相互关联问题的能力,而且对话问答数据集由来自不同领域一系列文章中的对话问题组成,答案的形式非常自由,这些改进点都极大地提高了挑战赛的难度。



在此之前,包括微软、科大讯飞、搜狗等知名企业和院校,都曾经登顶榜单,其中微软在组合模型上,一度成为最佳记录保持者,引起业内瞩目。


追一科技团队在大规模预训练模型RoBERTa的基础上,融入了对抗训练(Adversarial training和知识蒸馏Knowledge Distillation的思想,同时兼顾了CoQA数据集的自身特点,实验结果表明,上述方法显著地提升了系统表现。目前,团队在2019年9月5日提交的RoBERTa + AT + KD系统,在CoQA榜位列第一,其中单模型single model的表现首次全面超越人工评测指标。 


此次登顶CoQA,也是追一科技持续耕耘AI技术的成果之一。作为以技术创新为核心驱动力的AI公司,追一科技一直专注在前沿AI语义交互与算法技术的攻坚,在意图识别、情感分析、知识图谱、阅读理解、多轮对话等领域不断取得突破。并获得了2018 CMRC机器阅读理解比赛冠军、2019年CCF语言与智能技术竞赛的“知识驱动对话”冠军。


除了技术突破,追一科技一直坚持研发与应用互相驱动,规模化落地AI应用。追一科技的智能产品和解决方案,已经在金融、运营商、政企、泛互联网等众多领域落地,服务300多家行业标杆客户。与此同时,追一科技还致力于创新型技术的应用落地、量产及标准化,例如,阅读理解、多模态交互数字人等技术和产品,已经在部分券商、银行伙伴场景中应用,实现业内突破。


随着NLP等AI技术的突破,产业智能化时代的到来,多行业场景化需求将对技术创新和产品化能力提出更多挑战。追一科技将继续专注创新能力,攻坚技术前沿,以技术创新赋能更多行业伙伴!


追一科技完成C轮4100万美元融资,助力产业智能化升级

依图再夺世界级冠军,这次是“声纹识别”!

榕报·8月 | 依图承建视觉计算国家新一代AI开放创新平台,拼多多、虎牙等发布Q2财报...


登录查看更多
7

相关内容

【ACL2020-Allen AI】预训练语言模型中的无监督域聚类
专知会员服务
23+阅读 · 2020年4月7日
【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答
专知会员服务
82+阅读 · 2019年12月14日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
2019中国硬科技发展白皮书 193页
专知会员服务
77+阅读 · 2019年12月13日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
133+阅读 · 2019年12月12日
FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
23+阅读 · 2019年10月18日
微软机器阅读理解在一场多轮对话挑战中媲美人类
微软丹棱街5号
19+阅读 · 2019年5月14日
AI会话能力超越人类!CoQA挑战赛微软创新纪录
媲美人类对话水平!微软最新NLP模型3项评分全面超越人类水平!
机器学习算法与Python学习
8+阅读 · 2019年5月4日
Knowledge Based Machine Reading Comprehension
Arxiv
4+阅读 · 2018年9月12日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
QuAC : Question Answering in Context
Arxiv
4+阅读 · 2018年8月21日
VIP会员
Top
微信扫码咨询专知VIP会员