知识图谱的研究之所以引起了众多研究者的关注,是因为面向知识图谱和图数据为计算机研究者提供一个非常好的交叉研究对象,这包括自然语言处理、数据库、知识工程和机器学习等领域。同时基于知识图谱的工业应用,也是各大互联网公司以及一些创业型企业共同关注的焦点。
◆ ◆ ◆ ◆
The CCF Advanced Disciplines Lectures
中国计算机学会学科前沿讲习班
CCF ADL 第96期
主题《知识图谱和图数据的管理方法与系统》
时间:2018年9月19-21日
地点:中科院计算技术研究所
◆ ◆ ◆ ◆
扫码二维码报名
知识图谱和图数据是目前计算机学科相关研究中的热点,其具体研究涵盖知识图谱构建,知识图谱的存储和查询系统,面向知识图谱应用,以及大图数据的处理分析方法及系统等。知识图谱的研究之所以引起了众多研究者的关注,是因为面向知识图谱和图数据为计算机研究者提供一个非常好的交叉研究对象,这包括自然语言处理、数据库、知识工程和机器学习等领域。同时基于知识图谱的工业应用,也是各大互联网公司以及一些创业型企业共同关注的焦点。
本期CCF学科前沿讲习班《知识图谱和图数据的管理方法与系统》邀请到了知识图谱构建、图数据的存储查询、知识图谱应用以及大图处理以及分析系统等领域重量级的专家学者做主题报告。他们将对知识图谱和图数据等基础理论、关键技术方法以及当前热点问题进行深入浅出的介绍,并对如何开展本领域前沿技术研究等进行探讨。使参加者在了解学科热点、提高理论水平的同时,掌握最新技术趋势。
学术主任:
邹磊
邹磊,北京大学计算机科学技术研究所教授、国家自然科学基金委优秀青年基金项目获得者,北京大学大数据科学研究中心主任助理。目前的主要研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理。邹磊及其团队构建了面向海量RDF知识图谱数据(超过100亿三元组规模)的开源图数据库系统gStore。邹磊已经发表了50余篇国内外学术论文,包括数据库领域国际顶级期刊/会议论文(SIGMOD,VLDB等)近30余篇; 邹磊获得2009年中国计算机学会优秀博士学位论文提名奖和2014年中国计算机学会自然科学二等奖(排名第一); 2017年获得教育部自然科学二等奖(排名第一)。
特邀讲者(按学术讲座时间顺序)
Jeffery Xu Yu
Title:Large Graph Processing: Algorithms and Systems
Abstract:Graph has been widely adopted to model complex networks. The real applications that need graph processing techniques to handle a large graph can be found from many real applications including online social networks, biological networks, ontology, transportation networks, etc. In this talk, we will discuss some selected research topics on graph processing over large graphs from the algorithm perspectives and the systems perspectives. From the algorithm perspectives, we will discuss several recent work on searching communities in large networks and on finding the hierarchy structure in large social networks. On one hand, social Community structures, as functional building blocks, exist in social networks. Thus, mining and querying community structure in large networks becomes an important issue for a deeper understanding and better management of such networks. On the other hand, social hierarchy is a fundamental concept in sociology and social network analysis. The importance of social hierarchy in a social network is that the topological structure of the social hierarchy is essential in both shaping the nature of social interactions between individuals and unfolding the structure of the social networks. From the system perspective, we will discuss several issues in developing a graph processing system.
Bio:Dr. Jeffrey Xu Yu is a Professor in the Department of Systems Engineering and Engineering Management, The Chinese University of Hong Kong. His current main research interests include graph mining, graph query processing, graph pattern matching, keywords search in databases, and online social networks. Dr. Yu served as an Information Director and a member in ACM SIGMOD executive committee (2007-2011),
an associate editor of IEEE Transactions on Knowledge and Data Engineering (2004-2008), and an associate editor in VLDB Journal (2007-2013). Currently he serves as an associate editor of ACM Transactions on Database Systems (TODS), WWW Journal, Data Science and Engineering, the International Journal of Cooperative Information Systems, the Journal on Health Information Science and Systems (HISS), and Journal of Information Processing. Dr. Yu served/serves in many organization committees and program committees in international conferences/workshops including PC Co-chair of APWeb'04, WAIM'06, APWeb/WAIM'07, WISE'09, PAKDD'10, DASFAA'11, ICDM'12, NDBC'13, ADMA'14, CIKM'15 and Bigcomp17, and conference general Co-chair of APWeb'13 and ICDM'18.
邹磊
Title:基于图的海量知识图谱数据管理
Abstract:RDF用W3C提出是对于语义网中的Web对象建模的数据模型。目前,已经涌现出大量的RDF知识库,比较著名的有DBPedia,Yago,Yago2和Freebase等。同时,很多IT公司也在致力于大规模RDF知识库的构建,例Google的知识库图谱,微软的Satori,搜狗公司的知立方,以及百度的实体搜索。大规模RDF知识库为目前的数据管理领域带来了新的挑战和机遇,例如如何有效地存储和检索这些大规模的RDF知识库数据。在本次的报告中,我首先回顾一些经典的按照关系数据库的方法来管理RDF数据的技术。然后,我集中讨论从图数据库的观点来研究RDF数据管理的问题。具体的,我将讨论如何利用图数据库中的子图匹配技术来处理RDF知识库中的查询问题。我讨论两种查询,SPARQL和自然语言查询,以及如何利用子图匹配来有效地回答这两类查询。最后,我将演示我们的基于图的RDF数据管理Demo系统,gStore和gAnswer;前者是用来设计支持SPARQL 1.1的RDF存储和查询系统,后者是用来支持自然语言和关键词的RDF语义检索系统
Bio: 邹磊,北京大学计算机科学技术研究所教授、国家自然科学基金委优秀青年基金项目获得者,北京大学大数据科学研究中心主任助理。目前的主要研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理。邹磊及其团队构建了面向海量RDF知识图谱数据(超过100亿三元组规模)的开源图数据库系统。邹磊已经发表了50余篇国内外学术论文,包括数据库领域国际顶级期刊/会议论文(SIGMOD,VLDB等)近30余篇; 邹磊获得2009年中国计算机学会优秀博士学位论文提名奖和2014年中国计算机学会自然科学二等奖(排名第一); 2017年获得教育部自然科学二等奖(排名第一)。
肖仰华
Title:Data-driven Approaches for Large Scale Knowledge Graph Construction
Abstract:Building large scale knowledge graphs has attracted wide research interest due to the wide applications of knowledge graphs in search, recommendation, QA and many other tasks related to text understanding. Despite of the great progress in this direction, there are many weakness of the current approach in terms of effectiveness and efficiency. First, the knowledge extraction still requires huge human efforts both in feature engineering and data labeling. Second, the knowledge base after extraction usually suffers from low quality especially inconsistency and incompleteness. Third, the domain-specific knowledge base construction suffers from the sparsity of labeled data. In this talk, we will present solutions of my team (KW@FUDAN) in attacking these problems. Based on these solutions, our knowledge base published online including CN-DBpedia and ProbasePlus has served industries with 1 billions of API calls.
Bio:肖仰华 博士,复旦大学教授、博士生导师、复旦大学知识工场实验室创始人、上海市互联网大数据工程技术中心副主任、多家规模企业高级顾问与首席科学家、知识图谱前沿技术系列课程发起人、十多个国家/省市/企业研究奖项获得者、三十多个国家/省市/企业研发项目负责人。在国际顶级学术会议与期刊(包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、TKDE等)发表论文百余篇,授权近20项知识图谱专利。百余次担任国际/国内学术机构/会议的学术服务工作。领导构建了知识库云服务平台(知识工场平台kw.fudan.edu.cn),发布了一系列知识图谱,以API形式为数百家应用单位服务近10亿次。
Bin Shao
Title:Real-time Knowledge Graph Serving
Abstract:Knowledge proliferates and becomes increasingly linked. Connected knowledge is naturally represented and stored as knowledge graphs, which are of more and more importance for many frontier research areas such as machine intelligence. Big knowledge graph serving, especially in real-time, faces challenges at all levels. In this talk, we discuss the challenges of knowledge graph serving, propose several general principles of designing graph serving systems, and showcase some real-world graph serving applications.
Bio:Bin Shao is a lead researcher at Microsoft Research Asia. He joined Microsoft after receiving his Ph.D. degree from Fudan University in July 2010. Bin Shao is leading the Microsoft Graph Engine project, which is an open-source distributed in-memory large graph processing engine. His research interests include machine learning, in-memory databases, distributed systems, and parallel graph processing.
冯岩松
Title: 基于知识的智能问答技术
Abstract: 作为多种智能人机交互应用的核心技术,智能问答已受到学术界及工业界的广泛关注。特别是面对大规模结构化的知识图谱数据及非结构化的知识资源,如何从自然语言的提问中抽离出提问意图,并从大规模知识资源中找到答案是其中的核心挑战。本报告将在简单梳理问答系统的历史发展脉络、基本概念和技术流派的基础上,主要介绍面向大规模知识库的问答方法,以及在深度学习框架下的知识库问答技术,并对其中存在的问题和趋势进行分析和展望。
Bio: 冯岩松,信息科学博士,北京大学计算机科学与技术研究所副教授。主要研究方向包括自然语言处理、信息抽取以及机器学习在自然语言处理中的应用;已连续三年在面向结构化知识库的知识问答评测 QALD-4, 5, 6 中获得第一名;相关工作已发表在 TPAMI、ACL、EMNLP 、AAAI等主流期刊与会议上。同时,作为项目负责人或课题骨干已承担多项国家自然科学基金及科技部 863 计划项目。分别在 2014、2015 年获得 IBM Faculty Award,及 2016 年 IBM Shared University Research Award。
报名须知
1、报名费:CCF会员2500元,非会员3000元,非会员同时加入学会2700元(学生2550元)。开班现场报名,需缴纳报名费4000元(仅支持公务卡,不收取现金)。食宿交通自理。根据交费先后顺序,会员优先的原则录取,额满为止。
给予西部五所高校两个名额,可免费,限CCF会员, 需个人提出书面申请并加盖院系公章,将电子版发至adl@ccf.org.cn, CCF将按照申请顺序进行录取。(五所高校的名单如下:新疆大学,青海大学,云南大学,贵州大学,宁夏大学。)
2、入会流程:扫描二维码,点击“会员”—>“加入CCF”—>缴费。会费:会员200元/年。学生会员:50元/年。
3、报名截止及缴费说明:
(1)报名截止日期:2018年9月18日。报名请尽量预留不会拦截外部邮件的邮箱,收到报名费,CCF会发送确认邮件到您邮箱;
(2)CCF会员报名,请务必在报名表中填写在有效期内的CCF会员号。否则按非会员处理;
(3)纸质发票开具周期长,请尽量选取电子发票;
(4)通过支付宝缴费,请将交费页面截图作为附件发送到 adl@ccf.org.cn邮箱,主题为“ADL96+学员姓名”。
4、缴费方式:
银行转账(支持网银、支付宝):
开户行:北京银行北京大学支行
户名:中国计算机学会
账号:0109 0519 5001 2010 9702 028
缴费请务必注明:ADL96+学员姓名
5、联系:李红梅
邮箱 : adl@ccf.org.cn 电话:18810669757
中国计算机学会
长按识别二维码关注我们
点击“阅读原文”,报名参加。