知识图谱已被用于支持广泛的应序,并增强了多个主要搜索引擎(如Google和Bing)的搜索结果。在亚马逊,我们正在构建一个产品图谱,一个全球所有产品的权威知识图。我们需要建立数千个产品垂直模型,我们需要从中提取知识的大量数据源,我们每天需要处理的大量新产品,以及我们希望支持的搜索、发现、个性化、语音等各种应用程序,都给构建这样一个图带来了巨大的挑战。

在本次演讲中,我们将介绍我们为数千种产品收集知识所做的努力。我们将介绍如何确定交付数据业务最重要的第一步:培训生成准确数据的高精度模型。然后,我们描述了如何通过从有限的标签中学习来扩展模型,以及如何通过多模式模型和web提取来提高收益率。我们分享了构建此产品图谱并将其应用于支持面向客户的应用的许多经验教训。

https://web.stanford.edu/class/cs520/abstracts/dong.html

成为VIP会员查看完整内容
0
35

相关内容

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

大多数大型在线推荐系统,如新闻推送排名、人员推荐、工作推荐等,通常都有多个实用工具或指标需要同时优化。经过训练以优化单一效用的机器学习模型通过参数组合在一起,生成最终的排名函数。这些组合参数驱动业务指标。找到正确的参数选择通常是通过在线A/B实验,这是非常复杂和耗时的,特别是考虑到这些参数对指标的非线性影响。

在本教程中,我们将讨论如何应用贝叶斯优化技术为这样复杂的在线系统获取参数,以平衡竞争性指标。首先,我们将深入介绍贝叶斯优化,包括一些基础知识以及该领域的最新进展。其次,我们将讨论如何将一个真实世界的推荐系统问题制定为一个可以通过贝叶斯优化解决的黑盒优化问题。我们将专注于一些关键问题,如新闻推送排名、人员推荐、工作推荐等。第三,我们将讨论解决方案的架构,以及我们如何能够为大规模系统部署它。最后,我们将讨论该领域的扩展和一些未来的发展方向。

https://sites.google.com/view/ijcai2020-linkedin-bayesopt/home

成为VIP会员查看完整内容
0
30

第十九届国际语义网会议(ISWC2020)将于11月1日至6日远程召开。国际语义网会议是全球最重要的且最有影响力的国际学术会议,主要聚焦语义网,知识图谱,本体,链接数据等面向互联网的人工智能技术。国际语义网会议将聚集研究人员,从业人员和行业专家,以讨论、发展和塑造语义网和知识图谱技术的未来。

How to build large knowledge graphs efficiently (LKGT)

构建和管理一个知识图谱需要一些努力和语义技术方面的大量经验。将这个知识图谱转化为解决问题的有用资源需要更多的努力。一个重要的考虑是提供成本敏感的方法来构建一个对各种应用有用资源的知识图谱:“知识图谱细化有两个主要目标: (a)将缺失的知识添加到图谱中。(b)识别知识图谱中的错误信息,即错误检测。(Paulheim等,2017)本教程的目标是从知识存储的知识创建、知识管理到知识部署的过程——使用schema.org和schema.org的领域扩展作为本体应用于知识图谱。本教程将以讲师合著的《知识图谱——方法论、工具和选定用例》(Fensel et al. 2020)为基础,是讲师在SEMANTICS2019和2020年知识图谱会议上发表的教程的扩展和改编版本。

https://stiinnsbruck.github.io/lkgt/

成为VIP会员查看完整内容
0
44

在这项综述中,我们提供了一个在信息检索(IR)背景下的知识图谱(KGs)的文献综述。现代信息检索系统可以以多种方式从知识图谱中获益,不论知识图谱是公开的还是专有的。我们提供了构建利用KGs和使用我们讨论的面向任务的材料组织的IR系统所需的组件的概述。了解IR和KGs的交集对许多研究者和实践者有益,我们从两个互补的角度来考虑之前的工作: 利用KGs进行信息检索和利用IR技术丰富KGs。我们首先讨论如何使用KGs来支持IR任务,包括文档和实体检索。接下来,我们将描述如何使用IR和语言技术构建和完成KGs,包括实体识别、类型和关系提取等任务。我们讨论在我们考虑的任务中出现的常见问题,并确定解决这些问题的未来方向。我们还提供了数据集和其他资源的指南,应该是有用的新手和经验丰富的研究人员在该领域。

https://www.nowpublishers.com/article/Details/INR-063

成为VIP会员查看完整内容
0
94

为机器配备对世界实体及其关系的全面了解一直是人工智能的一个长期目标。在过去的十年中,大规模知识库(也称为知识图谱)已经从Web内容和文本源中自动构建出来,并且已经成为搜索引擎的关键模块。这种机器知识可以被用来从语义上解释新闻、社交媒体和网络表格中的文本短语,并有助于回答问题、自然语言处理和数据分析。本文调查基本概念和实际的方法来创建和管理大型知识库。它涵盖了用于发现和规范化实体及其语义类型以及将它们组织成干净的分类法的模型和方法。在此基础上,本文讨论了以实体为中心的属性的自动提取。为了支持机器知识的长期生命周期和质量保证,本文提出了构建开放模式和知识管理的方法。学术项目的案例研究和工业知识图表补充了概念和方法的调查。

概述

增强计算机的“机器知识”,可以推动智能应用是计算机科学的一个长期目标[323]。由于知识获取方面取得了重大进展,这一以前难以捉摸的愿景如今已变得切实可行。这包括将嘈杂的互联网内容转化为实体和关系上的清晰知识结构的方法。知识获取方法使得自动建设知识库(KB):机器可读的关于现实世界的事实的集合。如今,公开的KBs提供了数以百万计的实体(比如人、组织、地点和书籍、音乐等创意作品)和数十亿的声明(比如谁研究了哪里,哪个国家拥有哪一种资本,或者哪位歌手演唱了哪首歌)。大公司部署的专有KBs包含了更大范围的知识,有一到两个数量级的实体。

知识库成为关键资产的一个突出用例是Web搜索。当我们向百度、Bing或谷歌发送一个类似“迪伦抗议歌曲”的查询时,我们会得到一个清晰的歌曲列表,比如《Blowin ' in the Wind》、《Masters of War》或《a- gonna Rain ' s a- gonna Fall》。因此,搜索引擎自动检测到我们对某一个体实体的事实感兴趣——这里是鲍勃·迪伦——并要求特定类型的相关实体——抗议歌曲——作为答案。这是可行的,因为搜索引擎在其后端数据中心有一个巨大的知识库,有助于发现用户请求(及其上下文)中的实体,并找到简明的答案。

本文介绍了从Web和文本源自动构建和管理大型知识库的方法。我们希望它将对博士生和对广泛的主题感兴趣的教师有用——从机器知识和数据质量到机器学习和数据科学,以及web内容挖掘和自然语言理解的应用。此外,本文还旨在为从事web、社会媒体或企业内容的语义技术的行业研究人员和实践者提供帮助,包括从文本或半结构化数据构建意义的各种应用程序。不需要有自然语言处理或统计学习的先验知识;我们将根据需要介绍相关的方法(或至少给出文献的具体指示)。

这篇文章共分为十章。第2章给出了知识表示的基础知识,并讨论了知识库的设计空间。第3、4和5章介绍了构建包含实体和类型的知识库核心的方法。第3章讨论了利用具有丰富和干净的半结构化内容的优质资源,第4章讨论了从文本内容中获取的知识。第5章特别关注将实体规范化为唯一表示的重要问题。第6章和第7章通过发现和提取实体的属性以及实体之间的关系的方法扩展了知识库的范围。第6章主要讨论为感兴趣的属性预先设计模式的情况。第7章讨论了为KB模式中尚未指定的属性和关系发现新的属性类型的情况。第8章讨论了知识库管理和知识库长期维护的质量保证问题。第9章介绍了几个具体KBs的案例研究,包括工业知识图谱(KGs)。我们在第10章以关键课程和关于机器知识主题可能走向的展望来结束。

成为VIP会员查看完整内容
0
138

异常检测已经得到了广泛的研究和应用。建立一个有效的异常检测系统需要研究者和开发者从嘈杂的数据中学习复杂的结构,识别动态异常模式,用有限的标签检测异常。与经典方法相比,近年来深度学习技术的进步极大地提高了异常检测的性能,并将异常检测扩展到广泛的应用领域。本教程将帮助读者全面理解各种应用领域中基于深度学习的异常检测技术。首先,我们概述了异常检测问题,介绍了在深度模型时代之前采用的方法,并列出了它们所面临的挑战。然后我们调查了最先进的深度学习模型,范围从构建块神经网络结构,如MLP, CNN,和LSTM,到更复杂的结构,如自动编码器,生成模型(VAE, GAN,基于流的模型),到深度单类检测模型,等等。此外,我们举例说明了迁移学习和强化学习等技术如何在异常检测问题中改善标签稀疏性问题,以及在实际中如何收集和充分利用用户标签。其次,我们讨论来自LinkedIn内外的真实世界用例。本教程最后讨论了未来的趋势。

https://sites.google.com/view/kdd2020deepeye/home

成为VIP会员查看完整内容
0
77

知识图谱封装了实体和关系。知识图谱的简洁表示格式和图的特性使得许多新的Web应用程序得以创建,并增强了现有的应用性能。然而,在一个知识图谱中,描述一个实体的几十个或几百个事实可能会超出一个典型用户界面的能力,并使用户超载过多的信息。这激发了对实体摘要的富有成果的研究——为实体自动生成紧凑的摘要,以高效和有效地满足用户的信息需求。例如,在其搜索结果页面右侧,谷歌通过选择和显示用户可能正在搜索的特定实体的一些事实,为其知识图中的实体提供“最佳摘要”。

近年来,研究人员通过提出从纯粹的排序和挖掘技术到机器和深度学习技术等各种方法,对这个问题做出了贡献。技术水平不断提高,同时也使社区和新来者很难跟上该领域最近和过去的贡献。此外,尽管知识图谱在学术界和产业界越来越流行,但迄今为止还没有对该问题领域的最新趋势和基本构件进行教育和讨论。本教程的目的就是填补这一空白。

链接: https://pan.baidu.com/s/1qSv16wZEAJWUcwx40ByvwQ 提取码: g9bq

成为VIP会员查看完整内容
0
54

主题: Ceres: Harvesting Knowledge from Semi-Structured web pages

摘要: 在本次主题演讲中,Xin Luna Dong讲述了知识图谱的类型,讲述了为什么需要半结构网页,以及如何从半结构化网页获取知识。

嘉宾介绍: Xin Luna Dong,自2016年7月起担任亚马逊首席科学家,领导亚马逊产品知识图的构建工作,管理科学家团队开展知识管理、数据清洗与集成、信息提取、图形挖掘与嵌入、基于知识的搜索与推荐等方面的研究。

成为VIP会员查看完整内容
0
9
小贴士
相关VIP内容
专知会员服务
107+阅读 · 3月10日
专知会员服务
38+阅读 · 2020年12月1日
专知会员服务
140+阅读 · 2020年11月24日
专知会员服务
44+阅读 · 2020年11月7日
专知会员服务
94+阅读 · 2020年11月1日
专知会员服务
138+阅读 · 2020年10月6日
专知会员服务
77+阅读 · 2020年8月28日
相关资讯
ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答
AI科技评论
12+阅读 · 2020年6月29日
如何构建行业知识图谱(以医疗行业为例)
【知识图谱】中医临床知识图谱的构建与应用
产业智能官
45+阅读 · 2017年12月18日
领域应用 | 中医临床知识图谱的构建与应用
开放知识图谱
23+阅读 · 2017年12月12日
【知识图谱】AI基石知识图谱与百度AI布局
产业智能官
28+阅读 · 2017年11月20日
达观数据技术干货 | 搜你所想”之用户搜索意图识别
数据挖掘入门与实战
4+阅读 · 2017年6月30日
相关论文
Infusing Multi-Source Knowledge with Heterogeneous Graph Neural Network for Emotional Conversation Generation
Yunlong Liang,Fandong Meng,Ying Zhang,Jinan Xu,Yufeng Chen,Jie Zhou
4+阅读 · 2020年12月9日
Aidan Hogan,Eva Blomqvist,Michael Cochez,Claudia d'Amato,Gerard de Melo,Claudio Gutierrez,José Emilio Labra Gayo,Sabrina Kirrane,Sebastian Neumaier,Axel Polleres,Roberto Navigli,Axel-Cyrille Ngonga Ngomo,Sabbir M. Rashid,Anisa Rula,Lukas Schmelzeisen,Juan Sequeda,Steffen Staab,Antoine Zimmermann
79+阅读 · 2020年3月4日
Heterogeneous Graph Transformer
Ziniu Hu,Yuxiao Dong,Kuansan Wang,Yizhou Sun
18+阅读 · 2020年3月3日
Tianshuo Zhou,Ziyang Li,Gong Cheng,Jun Wang,Yu'Ang Wei
4+阅读 · 2019年10月11日
Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction
Shun Zheng,Wei Cao,Wei Xu,Jiang Bian
9+阅读 · 2019年9月23日
Structured Query Construction via Knowledge Graph Embedding
Ruijie Wang,Meng Wang,Jun Liu,Michael Cochez,Stefan Decker
6+阅读 · 2019年9月6日
Fabio Petroni,Tim Rocktäschel,Patrick Lewis,Anton Bakhtin,Yuxiang Wu,Alexander H. Miller,Sebastian Riedel
5+阅读 · 2019年9月4日
Bang Liu,Weidong Guo,Di Niu,Chaoyue Wang,Shunnan Xu,Jinghong Lin,Kunfeng Lai,Yu Xu
6+阅读 · 2019年5月21日
Ziwei Zhang,Peng Cui,Wenwu Zhu
40+阅读 · 2018年12月11日
Zhao Yan,Duyu Tang,Nan Duan,Shujie Liu,Wendi Wang,Daxin Jiang,Ming Zhou,Zhoujun Li
3+阅读 · 2018年1月23日
Top