【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答

【导读】阿里小蜜是阿里巴巴服务领域的重要人工智能产品,是服务于阿里巴巴经济体、商家、企业和政府的对话机器人家族,包括阿里小蜜、店小蜜、云小蜜。小蜜机器人是基于大数据和人工智能技术形成的智能化、体系化客服系统,可以辅助企业智能决策、节约服务成本、提高服务效率、提升用户体验。作为阿里小蜜的基石,知识是小蜜体系中不可或缺的组成部分。小蜜的知识不仅仅包括常见的 FAQ,还包括词组、知识图谱、机器阅读文档等丰富的结构形态。本文主要分享阿里小蜜团队最新一篇论文AliMe KBQA:面向电子商务客户服务的结构化知识问答《AliMe KBQA: Question Answering over Structured Knowledge for E-commerce Customer Service》,12页pdf,详细描述了阿里小蜜KBQA的细节


AliMe KBQA:面向电子商务客户服务的结构化知识问答


【摘要】随着知识图谱(KG)的兴起,基于知识库的问答(KBQA)近年来受到越来越多的关注。尽管在这个问题上已经做了很多研究,但是在工业界应用KBQA技术仍然具有挑战性,因为业务知识和现实世界的问题可能相当复杂。在这篇论文中,我们提出了AliMe-KBQA,一个将KBQA应用于电子商务客户服务领域的大胆尝试。为了处理真实的知识和问题,我们扩展了经典的“主语-谓词-对象(SPO)”结构的属性层次、键-值结构和复合值类型(CVT),并利用约束识别和推理能力增强了传统的KBQA。我们在2018年“双十一”期间为商家推出营销推广场景中的AliMe-KBQA,以及之后的其他此类推广活动。在线结果表明,AliMe-KBQA不仅能够获得更好的解决方案,提高客户满意度,而且由于提供了更方便、高效的管理体验,成为业务知识型员工首选的知识管理方法


1. 引言


AliMe[13]是电子商务客服领域提供售后服务的智能助手。通过问答对(QA)知识表示和基于深度学习(DL)的文本匹配,AliMe在消费者社区取得了显著的成功:目前每天为数百万客户提供问题服务,能够解决90%以上的问题。然而,在商家社区中仍然有改进的空间,因为顾客的问题更加分散和复杂。


根据我们的观察,在知识管理和AliMe更好地理解客户问题方面仍然存在一些挑战。首先,我们的知识被组织成QA对,它们被广泛用作知识的索引,而不是真正的知识。QA对组织成的知识形式具有很强的冗余性(一块知识必须枚举处理现实生活场景,例如,两个QA对“⼀个账号可以绑定⼏个⼿机号?有多少电话号码可以绑定淘宝账户”和“为什么我的账号绑定⼿机时说超出限制?为什么系统显示电话号码的数量超过限制时手机绑定到我的帐户吗?”实际上指的是同一个知识”⼀个账号可以绑定6个⼿机号码一个淘宝账户最多可以联想到6电话号码”),更不用说有时不能详尽列出的问题,尤其是在实例级和成分知识(例如,知识员工必须维护这样一个问题“如何注册推广计划”在AliMe至少几十个项目)。


其次,通过QA表示,业务知识人员必须不断地分析规则,并针对类似甚至重复的场景(如促销方案)引出常见问题(faq),这可以通过为客户问题定义一个通用的模式结构来大大缓解。第三,QA对不支持推理,这在客户服务中确实是需要的,因为规则是非常重要的。例如,我们有一个规则”店铺级优惠和店铺级优惠不能同时使用(店内和店内优惠不能同时应用)”,但不要索引一个特定实例级知识像“优惠券和店铺红包不能同时使用(优惠券和店内红色包不能同时使用)”,在“优惠券(券)”和“店铺红包(店内红色包)”都是“店内折扣”类型的。


为了解决这些挑战,我们启动了知识云项目,旨在构建一个系统结构的知识表示,并使AliMe更好地理解客户的问题,而不是简单地进行匹配-基于文本或语义相似性的知识项目问题。


本文介绍了一种基于知识图的bot应用——AliMe-KBQA,并介绍了其基本知识表示和支持技术。据我们所知,这是KBQA技术首次大规模应用于客户服务行业。本文的贡献如下:


  • 扩展经典的SPO结构来获取实际知识和问题: (1)我们使用属性层次结构来组织知识,而不是平坦属性,并指导模糊的问题;(2)采用键值结构和复合值类型(CVT)来描述复杂的答案,实现精确的问题回答。


  • 基于我们的结构化知识表示,为传统的KBQA提供约束识别和推理能力,以支持电子商务客户服务领域中复杂的、面向规则的QA。


  • 推出AliMe-KBQA作为一个实际的QA bot在营销推广场景。在线结果表明,KBQA不仅能够从客户端获得更好的解析率和满意度,而且还能够提供更好的知识管理经验,因此受到业务知识人员的青睐。


论文其余部分的结构如下:第2节给出了我们的结构化知识表示;第3节讨论扩展的KBQA方法;第4节介绍了系统的特点;第五部分是对相关工作的回顾,第六部分是对论文的总结和对未来工作的展望。


2  知识表示


知识表示包括模式层和实体层。在模式层里面,我们定义类型、属性和值 ( 以及关系 )。其中类型可以包括实体类型和事件类型;对于属性,我们也做了一个扩展,支持子属性,也就是说我们的属性是有层级关系的,可以组成属性链;对于值的定义除了保留原来 Text/字符串 ( Built-In 类型 ) 外,还加入两个新的类型:Key-Value 类型和 Compound Value Type ( CVT ) 类型。我们的这些扩展,可以充分增强 KG 的表达能力,应用于实际业务知识的表达和建模。实体层是对模式层的实例化。在实体层里面,我们采用类似的 "实体-属性-值" 和 "实体-关系-实体" 来对知识进行建模。


3  知识表示

通过识别用户问题中的实体、属性、约束 ( CVT 子属性 ),将用户的问题转换成可能的多个候选图,然后对候选图进行排序,选择得分最高的图,根据情况进行推理改写,并最终查询 KG 返回相应的结果。在这个过程中,可能还需要进行推荐或者反问以应对语义不清或者问题不完整的情况。上图展示展示了 KBQA 的基本问答流程。

便捷论文下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“Aliqa” 就可以获取《AliMe KBQA:阿里小蜜中的结构化知识问答》论文的下载链接索引~ 

参考链接:

论文地址

https://www.zhuanzhi.ai/paper/04fcc5f97a7fa8a4a5b985cdca66e27a

https://arxiv.org/abs/1912.05728



-END-
专 · 知


专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看5000+AI主题知识资料
展开全文
Top
微信扫码咨询专知VIP会员