HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

面向差分隐私保护的聚类算法

摘要:大数据时代的数据挖掘技术在研究和应用等领域取得了较大发展,但大量敏感信息披露给用户带来了众多威胁和损失。因此,在聚类分析过程中如何保护数据隐私成为数据挖掘和数据隐私保护领域的热点问题。传统差分隐私保护k-means算法对其初始中心点的选择较为敏感,而且在聚簇个数k值的选择上存在一定的盲目性,降低了聚类结果的可用性。为了进一步提高差分隐私k-means聚类方法聚类结果的可用性,研究并提出一种新的基于差分隐私的DPk-means-up聚类算法,同时进行了理论分析和比较实验。理论分析表明,该算法满足ε-差分隐私,可适用于不同规模和不同维度的数据集。此外,实验结果表明,在相同隐私保护级别下,与其他差分隐私k-means聚类方法相比,所提算法有效提高了聚类的可用性。

关键词:
  • 差分隐私  
  • 聚类算法  
  • 隐私保护  
作者:
胡闯; 杨庚; 白云璐
单位:
南京邮电大学计算机学院; 南京210003; 江苏省大数据安全与智能处理重点实验室; 南京210023; 南京中医药大学信息技术学院; 南京210023
刊名:
计算机科学

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机科学

计算机科学杂志紧跟学术前沿,紧贴读者,国内刊号为:50-1075/TP。坚持指导性与实用性相结合的原则,创办于1974年,杂志在全国同类期刊中发行数量名列前茅。