项目名称: 基于非显式隐私保护的大规模高维数据聚类方法研究
项目编号: No.61370213
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 张晓峰
作者单位: 哈尔滨工业大学
项目金额: 75万元
中文摘要: 随着人们的隐私保护意识的提升,如何在实现隐私保护的前提下,对大规模高维度数据进行准确的聚类分析,已经成为数据挖掘和隐私保护领域中的重要前沿交叉课题。这个课题的关键研究难点是:如何从高维特征空间中自动识别出最小完备非显式隐私维度集合,并设计出一个能逐步逼近目标聚类精度的自适应隐私维度保护方法,从而在满足隐私保护要求的前提下保证聚类结果的精准性。本课题围绕这个科学问题,提出了以下研究内容:(1)基于局部线性脊回归学习的最小完备非显式隐私维度识别算法,用于解决非显式隐私维度集的识别问题;(2)基于维度间相似度和偏离度计算的隐私维度保护方法,用于解决自适应调整隐私维度集的保护强度的问题;(3)基于自适应非显式隐私维度保护的新型高斯混合聚类算法,用于解决单源高维数据的最优聚类模型学习问题;(4)基于局部模型参数融合的全局聚类算法,用于解决大规模、多源高维数据的最优聚类模型学习问题。
中文关键词: 隐私保护;非显式隐私;聚类;;
英文摘要: With the increase of people's attention on privacy protection, how to protect data privacy as well as to perform accurate data clustering on large scale, high dimensional data set becomes one of the most important cutting edge research issues both in the
英文关键词: Privacy Protection;Implicit Privacy;Clustering;;