项目名称: 面向网络舆情分析的非确定性数据管理方法研究

项目编号: No.61202214

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 张铁赢

作者单位: 中国科学院计算技术研究所

项目金额: 25万元

中文摘要: 随着网络舆情应用深入到国计民生的各个领域,舆情分析所涉及到的非确定性数据呈爆炸性增长,已超过PB级。然而,目前的确定性数据管理方法满足无法舆情分析的需求,如分析功能不全、分析效率低下,从而无法准确地判断、分析和预测舆情动态。本项目结合舆情分析需求,充分利用云计算和云存储技术,全方位地研究面向舆情分析的大规模非确定性数据管理基础理论和方法,重点研究非确定性数据模型和数据集成方法、非确定性数据分布式存储策略和动态索引机制、非确定性数据并行查询处理算法与机制、非确定性数据对象缓存机制四个关键部分。项目研究成果不仅能解决舆情分析中遇到的非确定性数据管理瓶颈问题,还对构建大规模网络舆情数据中心有重要的方法论意义,同时对其它学科中出现的非确定性数据问题具有一定的借鉴意义。

中文关键词: 并发控制;数据模型;分布式数据库;图数据管理;查询解析

英文摘要: With the development of pubilic opinion application, the uncertain data for public opinion analysis is growing rapidly and has exceeded PetaBytes. However, the current data management method for certain data could not meet the requirements of public opinion analysis due to its uncomplete functions and low efficiency. Thus, the traditional method could not analyze accurately. This project takes the requirement of public opinion into full consideration and takes full advantage of cloud computing and cloud storage in order to study the uncertain data management methods and basic theories for public opinion analysis. We focus on the uncertain data model and integration, the distributed uncertain data storage method and dynamic index mechanism, parallel query algorithm and object cache scheme for uncertain data. This project aims to not only solve the bottleneck problem of uncertain data management in public opinion analysis but also provide the method to build large scale public opinion data center. Meanwhile, this project would represent a useful effort for the problem of the uncertain data management in other fileds.

英文关键词: concurrency control;data model;distributed database;graph data management;query analysis

成为VIP会员查看完整内容
0

相关内容

《信息安全技术 云计算服务安全指南》国家标准意见稿
专知会员服务
29+阅读 · 2022年4月14日
图神经网络综述
专知会员服务
193+阅读 · 2022年1月9日
面向端边云协同架构的区块链技术综述
专知会员服务
45+阅读 · 2021年12月24日
专知会员服务
49+阅读 · 2021年8月13日
专知会员服务
107+阅读 · 2021年1月8日
专知会员服务
44+阅读 · 2020年11月13日
专知会员服务
106+阅读 · 2020年10月27日
专知会员服务
190+阅读 · 2020年10月14日
专知会员服务
44+阅读 · 2020年8月20日
腾讯数据湖查询优化实践
专知
3+阅读 · 2022年3月24日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
网络舆情分析
计算机与网络安全
18+阅读 · 2018年10月18日
【知识图谱】 一个有效的知识图谱是如何构建的?
产业智能官
56+阅读 · 2018年4月5日
如何用Python做舆情时间序列可视化?
CocoaChina
10+阅读 · 2017年7月21日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
11+阅读 · 2018年4月8日
小贴士
相关主题
相关VIP内容
《信息安全技术 云计算服务安全指南》国家标准意见稿
专知会员服务
29+阅读 · 2022年4月14日
图神经网络综述
专知会员服务
193+阅读 · 2022年1月9日
面向端边云协同架构的区块链技术综述
专知会员服务
45+阅读 · 2021年12月24日
专知会员服务
49+阅读 · 2021年8月13日
专知会员服务
107+阅读 · 2021年1月8日
专知会员服务
44+阅读 · 2020年11月13日
专知会员服务
106+阅读 · 2020年10月27日
专知会员服务
190+阅读 · 2020年10月14日
专知会员服务
44+阅读 · 2020年8月20日
相关资讯
腾讯数据湖查询优化实践
专知
3+阅读 · 2022年3月24日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
网络舆情分析
计算机与网络安全
18+阅读 · 2018年10月18日
【知识图谱】 一个有效的知识图谱是如何构建的?
产业智能官
56+阅读 · 2018年4月5日
如何用Python做舆情时间序列可视化?
CocoaChina
10+阅读 · 2017年7月21日
相关基金
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员