本文转载自公众号:滴滴科技合作。
全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专业委员会组织和承办。2019年CCKS在杭州开幕。大会的主题是“知识智能”,旨在探讨大数据环境下语言理解、知识获取与智能服务的关键技术和应用。
8月27日,作为本次大会的亮点,知识图谱工业界论坛现场非常吸睛,滴滴、华为、美团、小米、阿里等产业界的研发人员带来了16场精彩报告,分享了他们在知识图谱构建、应用和测评方面的实践经验,促进产学研的合作。
滴滴出行自然语言处理和数据挖掘平台负责人李奘在工业界论坛发表“大规模知识图谱在滴滴的应用”的报告。报告从滴滴生态拥有的海量图谱数据出发,详述实体图谱和领域知识图谱在滴滴里的广泛研究和应用,包括基于实体图谱的复杂图计算服务,图嵌入,知识融合等案例服务,以及业务知识图谱中以智能对话机器人和知识推荐为代表的应用。
先前在自然语言处理领域顶级会议ACL 2019上,滴滴首次在NLP社区推广一系列自然语言处理工具集,包括基于深度学习的语音和自然语言理解模型训练平台DELTA,滴滴自然语言处理平台,ChineseNLP项目,以及滴滴机器人平台。
基于深度学习的语音和自然语言理解模型训练平台DELTA
DELTA主要基于TensorFlow构建,能同时支持NLP(自然语言处理)和语音任务及数值型特征的训练。整合了包括文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等重要算法模型,形成一致的代码组织架构,整体包装统一接口。目前AI开发者可登陆Github(https://github.com/didi/delta)查看DELTA的详细介绍和源代码。
滴滴自然语言处理平台
滴滴有丰富的业务场景和应用来检验自然语言算法模型的效果,并利用这些场景数据进一步优化了算法模型的效果,目前NLP平台已在公司内部提供了大量业务支持(安全(内容安全/黑产)、数据驱动的营销方式、运营数据分析、司乘体验优化、客服管理、智能客服等)。目前,该平台的主要功能及内部应用包括:分词、词句向量、命名实体识别、数据脱敏、语义相似度、情绪识别、翻译等。
ChineseNLP项目
在英文NLP领域,目前已经有汇总性网站跟踪英文NLP各个任务最新的研究进展,包括每个领域 (Task) 的标准数据集 ( test sets) 以及最新的 state-of-the-art。滴滴自然语言处理研究组正在搭建中文NLP领域的类似汇总性平台。团队已经完成中文NLP领域近20个任务的文档,致力于通过让学生和研究人员能够快速轻易地找到参考,从而推动中文自然语言处理研究的发展。欢迎访问https://github.com/didi/ChineseNLP 了解更多信息。
滴滴机器人平台
滴滴机器人平台是滴滴AI Labs自然语言处理组采用机器学习领域先进的技术,经滴滴客服等内外业务线长期使用验证,将自然语言理解和处理算法能力沉淀,适用于多种业务场景的通用机器人平台。
OpenKG
开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。