项目名称: 基于关键词的大规模链接数据搜索技术研究

项目编号: No.61502095

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 计算机科学学科

项目作者: 李慧颖

作者单位: 东南大学

项目金额: 20万元

中文摘要: 链接开放数据项目已经汇集了超过50 billions的RDF三元组,主题覆盖出版物、地理、多媒体、生命科学等众多领域。如何帮助用户获取感兴趣的数据和信息是当前语义Web研究领域最关心的问题之一。相比SPARQL查询必须掌握查询语言语法和待查询数据模式,普通用户更适合关键词查询方式。现有语义Web搜索引擎往往仅提供RDF文档或实体的搜索,不支持更复杂的查询需求(如查询多个实体及实体间的关系)。本课题研究基于关键词的大规模链接数据搜索问题:研究多粒度链接数据摘要模型和索引方法;研究关键词查询理解方法;研究高效地将关键词查询转换为结构化查询(用查询图表示)的方法;研究查询图相关性评价问题。最终帮助用户在大规模、异构、互链数据中跨数据源地进行高效和有效的关键词搜索。

中文关键词: 语义网;链接数据;语义搜索

英文摘要: Linking Open Data Project has collected more than 50 billions RDF triples, which covers a wide range of different topical domains such as publications, geographic, media, life sciences. How to retrieve information from such a large scale linked data is an important problem in the Sematic Web research field. Usually, user prefers to keyword query rather than SPARQL query, because it is difficult for the user to master the query language syntax and the RDF data schema. While existing Semantic Web search engines can only provide RDF document or entity searching instead of complex information query (such as association query). Our research focuses on the problem of keyword query over large scale linked data. We research the multi-granularity summary model and the index approach for linked data, the query understanding approach, the efficient keyword query approach that can convert keyword query to formal query (representing by schema graph), the approach to rank the schema graphs. The research will help users to make efficient and effective keyword query across the large scale, heterogeneous, linked data.

英文关键词: Semantic Web;Linked Data;Semantic Search

成为VIP会员查看完整内容
1

相关内容

语义网是一个以数据为核心,其中信息都能被机器理解并处理的网络。
「实体对齐」最新2022综述
专知会员服务
71+阅读 · 3月15日
【WWW2021】知识图谱逻辑查询的自监督双曲面表示
专知会员服务
26+阅读 · 2021年4月9日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
34+阅读 · 2020年12月9日
最新《知识图谱:构建到应用》2020大综述论文,261页pdf
专知会员服务
216+阅读 · 2020年10月6日
专知会员服务
60+阅读 · 2020年9月24日
基于知识图谱的行业问答系统搭建分几步?
PaperWeekly
2+阅读 · 2021年11月11日
公开课 | 多策略多模态知识问答技术实践
开放知识图谱
1+阅读 · 2021年10月24日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
14+阅读 · 2019年2月22日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
13+阅读 · 2018年10月29日
医学知识图谱构建技术与研究进展
人工智能学家
15+阅读 · 2017年11月11日
肖仰华 | 基于知识图谱的问答系统
开放知识图谱
22+阅读 · 2017年9月18日
大规模知识图谱的构建、推理及应用
人工智能头条
11+阅读 · 2017年8月29日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 4月20日
Arxiv
20+阅读 · 2020年10月11日
小贴士
相关资讯
基于知识图谱的行业问答系统搭建分几步?
PaperWeekly
2+阅读 · 2021年11月11日
公开课 | 多策略多模态知识问答技术实践
开放知识图谱
1+阅读 · 2021年10月24日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
14+阅读 · 2019年2月22日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
13+阅读 · 2018年10月29日
医学知识图谱构建技术与研究进展
人工智能学家
15+阅读 · 2017年11月11日
肖仰华 | 基于知识图谱的问答系统
开放知识图谱
22+阅读 · 2017年9月18日
大规模知识图谱的构建、推理及应用
人工智能头条
11+阅读 · 2017年8月29日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员