题目: A Heuristic Approach for Sensitive PatternHiding with Improved Data Quality
摘要: 频繁项集挖掘可用于发现数据集中存在的各种兴趣模式。然而,当数据与其他组织共享时,这会带来很大的优先级威胁。从组织或个人的角度来看,有一些业务关键型的频繁模式被认为是敏感的,因为披露这些模式会泄露机密信息。隐私保护数据挖掘(PPDM)提供了各种技术来隐藏敏感模式,以确保在共享数据集上应用数据挖掘模型无法显示这些模式。基于启发式的敏感模式隐藏技术因其执行速度快而被广泛采用,但其副作用较大。本文提出了一种基于受害者项删除的敏感模式隐藏启发式算法MinMax。在该算法中,计算每个暂定目标项的未命中代价Im-pact(MCI)值,并选择最小的目标项作为目标项,从而降低了未命中代价。在基准数据集上的实验结果表明,与现有的启发式技术相比,提出的算法具有更少的执行时间和更好的数据质量。
作者简介:
Durga Toshniowal,印度理工学院(IIT Rookee)计算机科学与工程系教授&运输系统中心主任。个人主页:http://www.durgatoshniwal.in/等