阿里开源人机对话模型ESIM，达摩院90后科学家研发，曾创世界纪录

会员服务 ·

阿里开源人机对话模型ESIM，达摩院90后科学家研发，曾创世界纪录

2019 年 7 月 7 日 量子位

乾明发自凹非寺
量子位报道 | 公众号 QbitAI

阿里巴巴，AI开源又有新动作。

这次是人机对话模型ESIM，全称Enhanced Sequential Inference Model，一种增强序列推断模型。

阿里介绍称，自2017年首次提出以来，这一研究已被谷歌、Facebook等在内的研究者在论文中引用200多次，也一度在国际顶级对话系统评测大赛（DSTC7）上获得双料冠军，将人机对话准确率的世界纪录提升至94.1%。

这一模型的主要应用场景为智能客服、导航软件、智能音箱等，现在已经被阿里巴巴应用到语音点餐机、地铁语音售票机、汽车交互系统等应用中。

开源地址：

https://github.com/alibaba/esim-response-selection

ESIM是什么？

ESIM首次提出是在2017年，论文的名称中就给出了直接的介绍：

Enhanced LSTM for Natural Language Inference，应用到自然语言推断的强化版LSTM。

从论文给出的模型架构图来看，ESIM模型由三个部分组成（下图左边部分是ESIM模型，右侧部分表示包含语法分析信息的网络）：输入编码（Input Encoding）、局部推断建模（Local Inference Modeling）和推断合成（Inference Composition）。

首先，在输入编码阶段，输入前提（Premise）和假设（Hypothesis）。在这一部分，BiLSTM学习如何表示一个单词及其上下文。

其次，在局部推断建模阶段。使用基于注意力的软对齐，来获得前提和假设之间的局部相关性。

最后，为了确定前提和假设之间的总体推断关系，使用一个组合层来合成增强的局部推断信息。

在序列推断模型中，继续使用BiLSTM序列来合成局部推断信息，然后将结果向量转化为池化的固定长度向量，并将其提供给最终的分类器来确定总体推断关系。

更多细节，请收好论文链接：
https://arxiv.org/abs/1609.06038

模型发布之后，便引发了极大关注，不仅在DSTC 7上拿下冠军，还成为了许多新发布数据集的评测标准之一，比如纽约大学的MultiNLI数据集、华盛顿大学的SWAG数据集等等。

DSTC 7冠军论文：

Sequential Attention-based Network for Noetic End-to-End Response Selection

https://arxiv.org/abs/1901.02609

达摩院90后科学家研发

ESIM模型，最初由达摩院语音实验室的陈谦等人研发。

陈谦，27岁，90后，博士毕业于中科大。2018年加入阿里巴巴，是2018届的阿里星之一。

进入阿里之后，取花名潭清，也是达摩院中最年轻的科学家之一。

在今年的国际顶级语音会议ICASSP 2019上，陈谦再度大放异彩：基于ESIM的研究在公开的标准数据集Ubuntu（英文）和E-commerce（中文）上均取得了最高的成绩。

论文链接：
Sequential Attention-based Network for Noetic End-to-End Response Selection
https://arxiv.org/abs/1901.02609

阿里巴巴这次开源项目，便是围绕着这一论文进行的。

最后，再放一下开源链接：
https://github.com/alibaba/esim-response-selection

— 完 —

AI社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

相关内容

人机对话

关注 193

人机对话，是人工智能领域的一个子方向，通俗的讲就是让人可以通过人类的语言（即自然语言）与计算机进行交互。作为人工智能的终极难题之一，一个完整的人机对话系统涉及到的技术极为广泛，例如计算机科学中的语音技术，自然语言处理，机器学习，规划与推理，知识工程，甚至语言学和认知科学中的许多理论在人机对话中都有所应用。

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

专知会员服务

57+阅读 · 2020年5月14日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答

专知会员服务

83+阅读 · 2019年12月14日