项目名称: 保护隐私的海量数据挖掘

项目编号: No.61202427

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 桑应朋

作者单位: 中山大学

项目金额: 25万元

中文摘要: 信息技术的飞速发展已经使得许多行业和部门积累了海量的数据。在不泄漏商业机密、用户隐私的条件下对这些海量数据进行挖掘,是信息共享、知识发现等实践应用中亟待解决的核心问题之一。现有研究的主要不足之处在于对海量数据变换时效率过低、挖掘时没有充分考虑数据变换带来的不确定性。本项目针对数据海量、异构的特点,为数据发布者和挖掘方提出系统的、创新性解决方案。对于数据发布者,本项目将提出兼具高效率、高安全、高数据可用性的隐私保护变换;对于数据挖掘方,本项目将研究新型数据挖掘方法,这些方法可适用于单一挖掘和联合挖掘,可调和隐私保护变换给数据带来的不确定性,可防止恶意参与者对挖掘过程的破坏,也将配备基于MapReduce的并行机制。本项目研究成果可高度适用于急需信息共享却受隐私保护法规限制的行业部门,如金融保险业、电信、医疗等,将有效促进不同行业间信息流通,带来可观的经济和社会效益。

中文关键词: 数据隐私保护;数据挖掘;异构海量数据;;

英文摘要: With the rapid development of information and communications technology,tera-scale data has been accumulated inside various governmental and private sectors. It becomes a critical problem in the applications of information sharing and knowledge discovery to conduct tera-scale data mining without leaking commercial secrecy and individual privacy. The major shortcomings of the state-of-the-art research are low efficiency in transforming tera-scale private data, and failure to consider the uncertainty produced by the transforms. This project aims at the tera-scale and heterogeneity of the private data, proposes systematic and novel solutions for both data publishers and miners. For the data publishers, the project will provide privacy-preserving transforms with high efficiency, high security, and high data utility. For the data miners, the project will provide new data mining approaches. These approaches will be suitable for single miner and federated miners, be able to leverage the uncertainty generated by the privacy-preserving transforms. They can thwart the sabotage on mining process by malicious participants, and are also coupled with parallel mining framework based on MapReduce. The outcomes of the project will be especially applicable to those sectors in highly demand of information sharing while restricted

英文关键词: Data privacy protection;Data mining;Heterogenous and Tera-scale data;;

成为VIP会员查看完整内容
0

相关内容

数据挖掘(Data mining)一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程。
「联邦学习隐私保护 」最新2022研究综述
专知会员服务
116+阅读 · 2022年4月1日
联邦学习研究综述
专知会员服务
148+阅读 · 2021年12月25日
鲁棒和隐私保护的协同学习
专知会员服务
35+阅读 · 2021年12月22日
区块链数据安全服务综述
专知会员服务
54+阅读 · 2021年11月10日
专知会员服务
29+阅读 · 2021年9月30日
专知会员服务
91+阅读 · 2021年7月23日
专知会员服务
51+阅读 · 2021年3月28日
专知会员服务
39+阅读 · 2020年12月20日
专知会员服务
112+阅读 · 2020年11月16日
专知会员服务
125+阅读 · 2020年8月7日
「联邦学习隐私保护 」最新2022研究综述
专知
16+阅读 · 2022年4月1日
视频隐私保护技术综述
专知
3+阅读 · 2022年1月19日
《鲁棒和隐私保护的协同学习》综述论文
专知
4+阅读 · 2021年12月22日
ICML'21 | 隐私保护下的图神经网络推荐系统
图与推荐
2+阅读 · 2021年11月4日
医疗健康大数据隐私保护综述
专知
3+阅读 · 2021年3月28日
美参议员提出商业面部识别隐私法案
蚂蚁金服评论
12+阅读 · 2019年4月25日
CCCF专栏 | 联邦学习
中国计算机学会
26+阅读 · 2018年11月19日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2008年12月31日
Age Optimal Sampling Under Unknown Delay Statistics
Arxiv
0+阅读 · 2022年4月20日
Detecting Deepfakes with Self-Blended Images
Arxiv
2+阅读 · 2022年4月18日
小贴士
相关VIP内容
「联邦学习隐私保护 」最新2022研究综述
专知会员服务
116+阅读 · 2022年4月1日
联邦学习研究综述
专知会员服务
148+阅读 · 2021年12月25日
鲁棒和隐私保护的协同学习
专知会员服务
35+阅读 · 2021年12月22日
区块链数据安全服务综述
专知会员服务
54+阅读 · 2021年11月10日
专知会员服务
29+阅读 · 2021年9月30日
专知会员服务
91+阅读 · 2021年7月23日
专知会员服务
51+阅读 · 2021年3月28日
专知会员服务
39+阅读 · 2020年12月20日
专知会员服务
112+阅读 · 2020年11月16日
专知会员服务
125+阅读 · 2020年8月7日
相关资讯
「联邦学习隐私保护 」最新2022研究综述
专知
16+阅读 · 2022年4月1日
视频隐私保护技术综述
专知
3+阅读 · 2022年1月19日
《鲁棒和隐私保护的协同学习》综述论文
专知
4+阅读 · 2021年12月22日
ICML'21 | 隐私保护下的图神经网络推荐系统
图与推荐
2+阅读 · 2021年11月4日
医疗健康大数据隐私保护综述
专知
3+阅读 · 2021年3月28日
美参议员提出商业面部识别隐私法案
蚂蚁金服评论
12+阅读 · 2019年4月25日
CCCF专栏 | 联邦学习
中国计算机学会
26+阅读 · 2018年11月19日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员