项目名称: 基于群智的开放式数据集成与分析技术研究
项目编号: No.61370060
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 王宁
作者单位: 北京交通大学
项目金额: 77万元
中文摘要: 随着开放数据运动的推进,政府及各种机构已将大量的公共数据发布到网上,Web逐渐成为一个巨大的蕴藏丰富资源的仓库,如何利用公共资源完成数据分析,成为数据集成领域新的挑战。本项目研究基于群智的开放式数据集成和分析技术,利用互联网上大众积累的开放数据实现"open-world"查询,帮助用户完成仅凭本地数据不能完成的分析任务。研究内容包括:(1)研究基于众包的语义集成和索引构建方法,利用大众智慧与机器算法的结合消除语义模糊,改善语义集成的质量,构建高质量的语义索引;(2)针对开放数据的特点,深度挖掘表之间的关联关系,建立关联关系分类、关联度定义和评分的理论模型和算法;(3)扩展关系模型,使其能统一表达局部和开放数据,以及处理开放数据的不一致性,并在此基础上探索新的查询重写和优化技术;(4)实现一个基于群智的面向互联网开放数据的集成和分析平台,通过真实的开放数据验证其有效性和效率。
中文关键词: 数据集成;众包;语义标注;查询优化;关联表
英文摘要: Following the Open Data trend, governments and public agencies have started making their data available on the Web, which makes Web a repository with huge amount of data. How to utilize these public resources for data analysis is a new challenge in data i
英文关键词: Data integration;Crowdsourcing;Semantic annotation;Query optimization;Related tables