项目名称: 大规模不确定和概率数据的在线近似分位概要技术研究

项目编号: No.61402375

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 梁春泉

作者单位: 西北农林科技大学

项目金额: 25万元

中文摘要: 分位概要技术是一种使用少量内存获取数据分布的数据压缩技术,可帮助数据库管理系统(DBMS)实施查询分析、查询计划与优化、统计数据分析以及数据库并行化等多种任务。近年来,随着技术的进步和人们对数据采集与处理技术理解的深入,数据不确定性逐渐得到重视。在环境监视、传感器网络、移动对象跟踪等大量应用领域中,由于设备精度限制、网络传输延迟、重复抽样等因素,不确定数据普遍存在。如何有效管理不确定数据已成为现代DBMS面临的重要挑战。分位概要技术可帮助DBMS对不确定数据实施有效管理。本项目拟对海量不确定数据分位概要技术进行研究,主要内容包括:(1)基于概率势的不确定数据在线近似分位概要技术研究;(2)基于可能世界概率分布的不确定数据在线近似分位概要技术研究;(3)滑动窗口上不确定数据流近似分位概要技术研究;(4)不确定数据倾斜分位概要技术研究。本项目的研究将为不确定数据管理和应用提供理论和技术支持。

中文关键词: 不确定数据集;分位概要;数据压缩;不确定数据管理;可能世界

英文摘要: Quantile summarization is one of data reduction techniques that are able to track the distribution of large datasets efficiently within small memory space. It helps Database Management System (DBMS) to run tasks including query analysis, query plan and op

英文关键词: Uncertain datasets;Quantile summaries;Data reduction;Uncertain data management;Possible worlds

成为VIP会员查看完整内容
0

相关内容

空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
35+阅读 · 2021年3月21日
「数据数学:从理论到计算」EPFL硬核课程
专知会员服务
42+阅读 · 2021年1月31日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
最新《生成式对抗网络GAN时空数据应用》综述论文,28pdf
专知会员服务
80+阅读 · 2020年6月20日
基于深度学习的多标签生成研究进展
专知会员服务
141+阅读 · 2020年4月25日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
空间数据智能:概念、技术与挑战
专知
8+阅读 · 2022年2月4日
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
基于海量日志和时序数据的质量建设最佳实践
阿里技术
0+阅读 · 2021年10月14日
CFGAN:基于生成对抗网络的协同过滤框架
已删除
将门创投
14+阅读 · 2019年5月29日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
0+阅读 · 2022年4月14日
小贴士
相关VIP内容
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
35+阅读 · 2021年3月21日
「数据数学:从理论到计算」EPFL硬核课程
专知会员服务
42+阅读 · 2021年1月31日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
最新《生成式对抗网络GAN时空数据应用》综述论文,28pdf
专知会员服务
80+阅读 · 2020年6月20日
基于深度学习的多标签生成研究进展
专知会员服务
141+阅读 · 2020年4月25日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
相关资讯
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
空间数据智能:概念、技术与挑战
专知
8+阅读 · 2022年2月4日
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
基于海量日志和时序数据的质量建设最佳实践
阿里技术
0+阅读 · 2021年10月14日
CFGAN:基于生成对抗网络的协同过滤框架
已删除
将门创投
14+阅读 · 2019年5月29日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员