项目名称: 支持海量非结构数据可视化分析的存储与索引

项目编号: No.61070051

项目类型: 面上项目

立项/批准年度: 2011

项目学科: 武器工业

项目作者: 钱卫宁

作者单位: 华东师范大学

项目金额: 11万元

中文摘要: 非结构化数据的可视化分析是"大数据"环境下数据利用的关键问题之一。本项目针对这一问题中数据量大、结构信息不完整、可视化要求即时性和交互性的特点,从数据管理的角度,以存储和索引对可视化分析所需要的相似性、聚集、交互式查询的支持为切入点,研究了1)面向可视化分析的非结构化数据语义建模;2)支持可视化分析的非结构化数据查询操作和查询语言;3)支持交互式查询的海量非结构化数据的分布式存储与索引;4)支持即时分析的非结构化数据统计量分布式维护等关键技术,并基于真实的海量非结构化数据(2TB微博数据),开发了用户集群行为分析可视化原型系统。在课题资助下,课题组成员在国际学术会议或学术期刊发表论文8篇(包括ICDE 2012会议论文1篇),申请专利1项,申请软件著作权1项,完成非结构数据分析标准测试集1套,培养硕士生2名,在国际学术会议DASFAA 2011上获得了Best Demo Award Runner-Up,在国际学术会议SocInfo 2011上获得Best Poster Award。项目研究内容和技术路线与预先设定相符;项目成果达到了项目任务书要求;项目管理和经费使用符合相关规定。

中文关键词: 非结构化数据; 海量数据管理; 存储与索引; 可视化分析

英文摘要: Visualized analysis of unstructured data is a key issue for taking full advantage of Big Data. This project aims at the challenges of huge volume and missing structure information of data, and requirements of on-demand and interactive visualization. To support the similarity, clustering, and interactive query processing for visualized analytics, storage and indexing methods for massive unstructured data are studied. Research results include: 1) semantic modeling for unstructured data; 2) query operator and query language for visualized analytics; 3) distributed storage and indexing over unstructured data for interactive query processing; 4) distributed statistics maintenance for on-demand analytical queries. Based on real-life massive unstructured datasets (2TB microblog data), a visualized analysis prototype system for collective bahavior research is implemented. Under the support of the project, eight research papers are published, including ONE ICDE 2012 full research paper, one patent and one software copyright applications are submitted. The project members have developed a set of benchmark for unstructured data analysis. The project members have been awarded the DASFAA 2012 Best Demo Award Runner-Up and SocInfo 2012 Best Poster Award. The research work is consistent to the pre-defined project tasks. The management of the project follows the rules of NSFC.

英文关键词: Unstructured data; massive data management; storage and indexing; visualized analysis

成为VIP会员查看完整内容
0

相关内容

面向数据可视化的自然语言接口: 综述论文
专知会员服务
19+阅读 · 2021年9月12日
【耶鲁】数据结构与编程技术,656页pdf
专知会员服务
55+阅读 · 2021年4月26日
专知会员服务
26+阅读 · 2021年3月7日
【耶鲁】数据结构与编程技术,572页pdf
专知会员服务
46+阅读 · 2020年12月27日
【2020新书】数据结构与数据表示指南,112页pdf
专知会员服务
82+阅读 · 2020年10月6日
【经典书】数据结构与算法C++,第二版,738页pdf
专知会员服务
166+阅读 · 2020年3月27日
表格存储 SQL 查询多元索引
阿里技术
0+阅读 · 2021年9月8日
【北大】知识图谱的关键技术及其智能应用
专知
112+阅读 · 2019年9月19日
支持个性化学习的行为大数据可视化研究
Elasticsearch地理信息存储及查询之Geo_Point
Analysys易观
13+阅读 · 2018年12月29日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【深度】多媒体计算国际团队:从单通道感知到跨媒体认知
中国科学院自动化研究所
73+阅读 · 2017年8月14日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
1+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月19日
Neural Architecture Search without Training
Arxiv
10+阅读 · 2021年6月11日
小贴士
相关资讯
表格存储 SQL 查询多元索引
阿里技术
0+阅读 · 2021年9月8日
【北大】知识图谱的关键技术及其智能应用
专知
112+阅读 · 2019年9月19日
支持个性化学习的行为大数据可视化研究
Elasticsearch地理信息存储及查询之Geo_Point
Analysys易观
13+阅读 · 2018年12月29日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【深度】多媒体计算国际团队:从单通道感知到跨媒体认知
中国科学院自动化研究所
73+阅读 · 2017年8月14日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员