资料介绍
K-匿名是数据发布应用场景下重要的隐私保护模型。近年来数据集K-匿名化的算法得到广泛的研究,Median Mondrian算法是目前唯一的多维K-匿名划分方法。文中研究了Median Mondrian算法,指出其不能有效地平衡数据划分精度与数据隐私安全性之间的矛盾,由此提出基于熵测度机制的多维K-匿名划分方法以及评估K-匿名化结果安全性的测量标准。实验表明该算法是可行的,能有效地提高数据安全性。
关 键 词 熵; K-匿名; 多维划分; 准标识符
中图分类号 TP309.2 文献标识码 A
Multidimensional K-anonymity Partition Method Using Entropy
YAN Hua,LIU Gui-song
(Computational Intelligence Laboratory, University of Electronic Science and Technology of China Chengdu 610054)
Abstract K-anonymity is an important privacy preserving model in the data publishing scenario. The algorithms on dataset K-anonymization are researched extensively in recent years, Median Mondrian algorithm is the only multidimensional K-anonymity partition method. However, our research shows that Median Mondrian algorithm is not well-balanced on dealing with the contradiction between data partition precision and data privacy preserving. In this paper, we propose an entropy-based multidimensional K-anonymity partition method and a new evaluation measure on K-anonymization results. The experimental results show that our new method is feasible and preserves the privacy much more efficiently than Median Mondrian algorithm.
Key words entropy; K-anonymity; multidimensional partition; quasi-identifier
近年来,数据的安全与隐私问题已经成为数据挖掘领域研究的重要课题之一。由于个人数据极容易被商业用途的应用收集与分析,所以越来越多的数据拥有者不愿意提供个人信息,除非个人信息中的敏感信息的隐私能得到保障。保护个人隐私信息最直接的方法是将能唯一标识一个人的属性信息(Identifier)隐藏,如姓名和身份证号码。但这种方法无法解决另一种隐私威胁问题,即链接攻击[1]。
链接攻击是指用户通过对发布的数据和其他渠道获得的数据进行链接处理,推演出隐私数据,从而造成隐私泄露。文献[1]提出的K-匿名数据模型正是为了解决链接攻击问题。为了实现数据集的K-匿名化,最有代表性的一类算法[2-4]是通过用户定义的概念层次结构实现K-匿名化,都属于单维的划分方法,其质量取决于使用的概念层次结构。文献[5-6]提出了目前唯一的一个多维K-匿名划分方法,即Median Mondrian算法。实验结果表明该近似的贪心算法能有效地实现数据集的K-匿名化。
K-匿名化后的数据以数值范围替代原始数据的精确值,并且至少有K个数据具有相同的表示,即数据的K-匿名化以损失数据的精确度实现数据的隐私保护。数据的精确度和数据的隐私安全性是相互矛盾的,现有的算法很难在上述两个指标上获得平衡。理想的数据K-匿名化结果应该是在尽可能地减少数据信息损失的情况下,实现数据的隐私安全的最大化。如果两组数据分布具有相同数值范围但数据分布不同,那么数据分布离散程度高的数据安全性高于数据分布相对集中的数据。Median Mondrian算法的设计是在简单满足K-匿名模型要求的前提下,追求数据划分精度的最大化,而在数据隐私安全性方面考虑不够。
熵是最能反映数据点多样性和不确定性的度量机制,因此,基于熵的概念,本文提出一种多维K-匿名划分方法,并针对数据隐私安全性提出新的K-匿名划分结果评价标准。
1 K-匿名模型中的基本概念
K-匿名模型相关概念的定义如下:已知数据集属于一个更大的数据分布12n,拥有属性集12为数据记录的第i个属性,为数据记录t属性[tA的值。
定义 1 标识符(Identifier)。数据集T的标识符I是指能唯一标识数据记录的属性。
- 基于密度的改进K-均值聚类组合方法 3次下载
- 基于节点分类的改进k度匿名隐私保护方法 4次下载
- 分布式K-自同构社会网络隐私保护算法 4次下载
- 一种基于密度的改进k-均值聚类组合方法 16次下载
- 基于MapReduce和加权网络信息熵的DBWGIE-MR算法 11次下载
- 一种基于图熵极值理论的领域概念聚类方法 10次下载
- 可划分边界区域数据的粗糙K-Means算法 13次下载
- 基于MapReduce/Spark的大规模压缩模糊K-近邻算法 5次下载
- 基于层次社区结构的大规模社会网络K-出入度匿名算法 8次下载
- 一种针对数据泄露的匿名模型GDPPR 18次下载
- 基于改进模糊熵和证据推理的多属性决策方法 1次下载
- 如何使用区域划分进行轨迹隐私保护 13次下载
- 基于局部信息熵值的子模式划分方法 1次下载
- 改进的K-均值算法在岩相识别中的应用
- 基于多维泛化路径的K-匿名算法
- 电机类型划分 1214次阅读
- 数据链系统的时隙划分方法 3637次阅读
- 详述多维度红外光电探测器 2489次阅读
- 利用比特币匿名交易的常见方式 2622次阅读
- MCU固件升级的闪存划分方法分享 4768次阅读
- 中国四大运营商在2G-5G频段划分范围详细数据 2.8w次阅读
- 采用FPGA技术芯片模块实现运动估计的设计方案并进行仿真研究 656次阅读
- 多维力传感器原理_多维力传感器的优点 2877次阅读
- 基于条件概率分类的两种模型算法:logistic回归模型与最大熵模型。 6976次阅读
- 如何选择以及有效使用不同的湍流模型 1.2w次阅读
- 如何进行分FPGA模块划分 5014次阅读
- vlan的划分方法有哪些_vlan技术详解 10w次阅读
- 多维数据库有哪些 7031次阅读
- 多维数据集是什么 9495次阅读
- 学习KNN算法的基本原理,并用Python实现该算法以及阐述其应用价值 5835次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB | 1490次下载 | 免费
- 2单片机典型实例介绍
- 18.19 MB | 93次下载 | 1 积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB | 27次下载 | 1 积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB | 18次下载 | 4 积分
- 5开关电源原理及各功能电路详解
- 0.38 MB | 11次下载 | 免费
- 6100W短波放大电路图
- 0.05 MB | 4次下载 | 3 积分
- 7基于AT89C2051/4051单片机编程器的实验
- 0.11 MB | 4次下载 | 免费
- 8基于单片机的红外风扇遥控
- 0.23 MB | 3次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB | 66304次下载 | 免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB | 51209次下载 | 免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB | 51043次下载 | 免费
- 5555集成电路应用800例(新编版)
- 0.00 MB | 33562次下载 | 免费
- 6接口电路图大全
- 未知 | 30320次下载 | 免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB | 28588次下载 | 免费
- 8开关电源设计实例指南
- 未知 | 21539次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935053次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537791次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191183次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183277次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138039次下载 | 免费
评论
查看更多