近日,由斯坦福大学发起的对话式问答挑战赛 CoQA(Conversational Question Answering Challenge)中,追一科技 AI Lab团队超越微软团队成为榜单第一,刷新了之前微软等团队创造的CoQA纪录。值得注意的是,团队提交的技术方案中,单模型的各项指标表现首次全面超越人类。
榜单地址:https://stanfordnlp.github.io/coqa/
阅读理解是目前语言AI最受关注、进步最快的技术方向,全球有两大顶级比赛最受瞩目,分别是注重一问一答的SQuAD和多轮对话问答的CoQA。相比SQuAD,CoQA比赛重点挑战的是模型在对话过程中回答相互关联问题的能力,而且对话问答数据集由来自不同领域一系列文章中的对话问题组成,答案的形式非常自由,这些改进点都极大地提高了挑战赛的难度。
在此之前,包括微软、科大讯飞、搜狗等知名企业和院校,都曾经登顶榜单,其中微软在组合模型上,一度成为最佳记录保持者,引起业内瞩目。
追一科技团队在大规模预训练模型RoBERTa的基础上,融入了对抗训练(Adversarial training)和知识蒸馏(Knowledge Distillation)的思想,同时兼顾了CoQA数据集的自身特点,实验结果表明,上述方法显著地提升了系统表现。目前,团队在2019年9月5日提交的RoBERTa + AT + KD系统,在CoQA榜位列第一,其中单模型(single model)的表现首次全面超越人工评测指标。
此次登顶CoQA,也是追一科技持续耕耘AI技术的成果之一。作为以技术创新为核心驱动力的AI公司,追一科技一直专注在前沿AI语义交互与算法技术的攻坚,在意图识别、情感分析、知识图谱、阅读理解、多轮对话等领域不断取得突破。并获得了2018 CMRC机器阅读理解比赛冠军、2019年CCF语言与智能技术竞赛的“知识驱动对话”冠军。
除了技术突破,追一科技一直坚持研发与应用互相驱动,规模化落地AI应用。追一科技的智能产品和解决方案,已经在金融、运营商、政企、泛互联网等众多领域落地,服务300多家行业标杆客户。与此同时,追一科技还致力于创新型技术的应用落地、量产及标准化,例如,阅读理解、多模态交互数字人等技术和产品,已经在部分券商、银行伙伴场景中应用,实现业内突破。
随着NLP等AI技术的突破,产业智能化时代的到来,多行业场景化需求将对技术创新和产品化能力提出更多挑战。追一科技将继续专注创新能力,攻坚技术前沿,以技术创新赋能更多行业伙伴!
榕报·8月 | 依图承建视觉计算国家新一代AI开放创新平台,拼多多、虎牙等发布Q2财报...