项目名称: 数据质量管理中的完整性约束关键技术研究

项目编号: No.61370101

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 金澈清

作者单位: 华东师范大学

项目金额: 73万元

中文摘要: 完整性约束管理是大数据质量管理的关键内容之一,在医疗卫生、企业信息管理等领域中意义重大。面向大数据的完整性约束管理模式已从"数据更新前检验约束条件"模式发展到"数据更新与约束检验相对独立"阶段,其难点在于如何在海量、分布、增量的数据库上高效管理近似唯一性约束、(条件)函数依赖等全局型(holistic)完整性约束,且支持自动检测与修复。本项目拟从四个方面进行探索,包括:1)设计面向集群的并行算法以提高系统的吞吐率;2)设计面向分布式网络环境的概要数据结构以降低网络传输开销;3)设计增量更新方法以避免每次监控时均要扫描全部数据集合;4)设计自动修复算法(或半自动修复算法)以避免过多采用人工干预。同时,采用理论分析、完整的实验测试来检验新方法与现有方法的差异性。相关研究成果预计将为大数据质量管理提供新的解决思路、显著提升数据的可用性,因而具有重要的理论与实践意义。

中文关键词: 数据质量;条件函数依赖;函数依赖;完整性约束;数据修复

英文摘要: As a critical component of big data quality management, integrity constraint has been widely used in many applications, such as health information management, enterprise information management, and so on. Nowadays, big data oriented integrity constraint m

英文关键词: data quality;conditional functional dependency;functional dependency;integrity constraint;data repair

成为VIP会员查看完整内容
2

相关内容

数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。有了普遍深入的数据质量,企业在任何时候都可以信任满足所有需求的所有数据。
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
面向大数据处理框架的JVM优化技术综述
专知会员服务
16+阅读 · 2021年11月27日
【WSDM2022】基于约束聚类学习离散表示的高效密集检索
专知会员服务
26+阅读 · 2021年11月16日
【2021新书】面向健康的机器学习与人工智能,428页pdf
专知会员服务
133+阅读 · 2021年5月21日
面向健康的大数据与人工智能,103页ppt
专知会员服务
109+阅读 · 2020年12月29日
专知会员服务
50+阅读 · 2020年11月20日
专知会员服务
45+阅读 · 2020年8月20日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
并发-分布式锁质量保障总结
阿里技术
0+阅读 · 2022年3月7日
数据质量漫谈
阿里技术
6+阅读 · 2021年12月26日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
已删除
将门创投
10+阅读 · 2018年5月2日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
1+阅读 · 2022年4月20日
Chinese Idiom Paraphrasing
Arxiv
0+阅读 · 2022年4月15日
Arxiv
0+阅读 · 2022年4月15日
小贴士
相关VIP内容
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
面向大数据处理框架的JVM优化技术综述
专知会员服务
16+阅读 · 2021年11月27日
【WSDM2022】基于约束聚类学习离散表示的高效密集检索
专知会员服务
26+阅读 · 2021年11月16日
【2021新书】面向健康的机器学习与人工智能,428页pdf
专知会员服务
133+阅读 · 2021年5月21日
面向健康的大数据与人工智能,103页ppt
专知会员服务
109+阅读 · 2020年12月29日
专知会员服务
50+阅读 · 2020年11月20日
专知会员服务
45+阅读 · 2020年8月20日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
并发-分布式锁质量保障总结
阿里技术
0+阅读 · 2022年3月7日
数据质量漫谈
阿里技术
6+阅读 · 2021年12月26日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
已删除
将门创投
10+阅读 · 2018年5月2日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员