项目名称: 面向相似性数据的自适应世系管理关键技术研究
项目编号: No.60973018
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 杨晓春
作者单位: 东北大学
项目金额: 31万元
中文摘要: 数据产生、并随着时间推移而演变的整个过程称为数据世系或数据溯源。数据世系管理对于用户理解数据的产生过程、确保数据的可重现、避免重复操作、对原始数据进行恢复等起到十分重要的作用。伴随着数据量的爆炸式增长,数据来源变得分散而广泛,导致数据具有来源多样性、粒度不统一、表示不一致性等特点。这些特点体现在数据具有一定程度的相似性,针对这些相似性数据进行世系管理变得更加复杂,具有挑战性。现有的世系管理技术对数据的上述特点支持不够,不具有自适应能力。项目旨在揭示相似性数据在产生和传递过程中的内在联系,为实现更加适合实际应用的世系管理提供重要的依据。主要研究内容包括:世系关系自适应抽取技术、世系关系的自动验证技术、动态存储管理技术、数据质量评价模型与相关算法研究。设计、实现和评价相关的算法, 争取在数据库理论和技术上取得一定的突破, 为今后的实际应用推广奠定坚实的基础。
中文关键词: 数据起源;数据世系管理;近似数据匹配;数据库;查询处理
英文摘要:
英文关键词: data provenance;data lineage management;approximate data matching;database;query processing