项目名称: 大规模不确定和概率数据的在线近似分位概要技术研究
项目编号: No.61402375
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 梁春泉
作者单位: 西北农林科技大学
项目金额: 25万元
中文摘要: 分位概要技术是一种使用少量内存获取数据分布的数据压缩技术,可帮助数据库管理系统(DBMS)实施查询分析、查询计划与优化、统计数据分析以及数据库并行化等多种任务。近年来,随着技术的进步和人们对数据采集与处理技术理解的深入,数据不确定性逐渐得到重视。在环境监视、传感器网络、移动对象跟踪等大量应用领域中,由于设备精度限制、网络传输延迟、重复抽样等因素,不确定数据普遍存在。如何有效管理不确定数据已成为现代DBMS面临的重要挑战。分位概要技术可帮助DBMS对不确定数据实施有效管理。本项目拟对海量不确定数据分位概要技术进行研究,主要内容包括:(1)基于概率势的不确定数据在线近似分位概要技术研究;(2)基于可能世界概率分布的不确定数据在线近似分位概要技术研究;(3)滑动窗口上不确定数据流近似分位概要技术研究;(4)不确定数据倾斜分位概要技术研究。本项目的研究将为不确定数据管理和应用提供理论和技术支持。
中文关键词: 不确定数据集;分位概要;数据压缩;不确定数据管理;可能世界
英文摘要: Quantile summarization is one of data reduction techniques that are able to track the distribution of large datasets efficiently within small memory space. It helps Database Management System (DBMS) to run tasks including query analysis, query plan and op
英文关键词: Uncertain datasets;Quantile summaries;Data reduction;Uncertain data management;Possible worlds