声明:本文转载自公众号 哈工大讯飞联合实验室
2018年12月12日,哈工大讯飞联合实验室(HFL)在由斯坦福大学发起的对话型机器阅读理解挑战赛CoQA(Conversational Question Answering Challenge)中获得冠军,这也是科大讯飞在2018年获得的第十二个世界冠军。
哈工大讯飞联合实验室(HFL)喜讯不断,在近日成功登顶机器阅读理解权威评测SQuAD 2.0后再次获得亮眼成绩。12月12日,在由斯坦福大学发起的对话型机器阅读理解挑战赛CoQA中,哈工大讯飞联合实验室凭借所研发的D-AoA + BERT模型,全面刷新所有评价指标,以总成绩80.2%位列该挑战赛的榜首,同时也是首个总成绩超过80%的系统,与人类在该数据上的平均水平差距进一步缩小。值得一提的是,哈工大讯飞联合实验室本次提交的单模型效果显著优于榜单上已有的多模型融合结果,凸显了哈工大讯飞联合实验室在机器阅读理解技术上的国际领先水平。CoQA挑战赛在2018年8月正式启动,吸引了众多国内外知名研究机构和高校,其中包括微软、艾伦研究院(AI2)、北京邮电大学、复旦大学等。
CoQA挑战赛最新成绩榜单(截止2018年12月12日)
与业界所熟知的机器阅读理解评测SQuAD一样,CoQA挑战赛同样由斯坦福大学发起,但侧重点与SQuAD评测不同。CoQA数据集中的问题不再是单轮的一问一答的形式,而是扩展到多轮的对话交互。从示例中我们可以看出,问题Q2的解答需要依赖上一轮的问题Q1,使得问题理解的难度大大增加。另外一个不同之处在于,CoQA数据的答案不再是完全来自于篇章中的某一个连续片段,其答案可以是Yes/No或其它一些没有出现在篇章中的内容,使得该数据集更加符合真实的应用场景。总的来说,CoQA挑战赛更加注重机器阅读理解技术在多轮对话中的应用,预示着机器阅读理解未来的研究方向,具有前瞻性、挑战性和实用性。
CoQA挑战赛数据示例
哈工大讯飞联合实验室资深研究员、阅读理解组研究主管、哈工大SCIR博士生崔一鸣介绍:将机器阅读理解技术和人机对话任务进行结合是自然的。相比传统生硬的一问一答的形式,通过多轮人机对话完成阅读理解并获取所需要的信息更加符合真实的应用场景,也是未来机器阅读理解技术落地的一大方向。
至此,哈工大讯飞联合实验室在2018年已获得四次机器阅读理解领域世界冠军,其中包括:
2018年1月,机器阅读理解挑战赛SQuAD 1.1夺冠
2018年2月,国际语义评测SemEval 2018阅读理解任务中夺冠
2018年11月,机器阅读理解挑战赛SQuAD 2.0夺冠
2018年12月,对话型机器阅读理解挑战赛CoQA夺冠
哈工大讯飞联合实验室(HFL)是科大讯飞针对“讯飞超脑”项目计划,重点引进和布局的核心研发团队之一,由科大讯飞AI研究院与哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)共同创办。根据联合实验室建设规划,双方将在语言认知计算领域进行长期、深入合作,具体开展阅读理解、自动阅卷、类人答题、人机对话、语音识别后处理、社会舆情计算等前瞻课题的研究。重点突破深层语义理解、逻辑推理决策、自主学习进化等认知智能关键技术,支撑科大讯飞实现从“能听会说”到“能理解会思考”的技术跨越,并围绕教育、司法、人机交互等领域实现科研成果的规模化应用。在2017年到2018年在业内公认的机器阅读理解顶级赛事斯坦福SQuAD 1.1以及2.0挑战赛中先后多次荣登榜首。2018年2月,获得国际语义评测SemEval-2018阅读理解任务的第一名。2018年5月,获得第五届中文语法检错大赛(CGEG)冠军。
本期责任编辑:丁 效
本期编辑:刘元兴
“哈工大SCIR”公众号
主编:车万翔
副主编: 张伟男,丁效
责任编辑: 张伟男,丁效,刘一佳,崔一鸣
编辑: 李家琦,吴洋,刘元兴,蔡碧波,孙卓,赖勇魁
长按下图并点击 “识别图中二维码”,即可关注哈尔滨工业大学社会计算与信息检索研究中心微信公共号:”哈工大SCIR” 。