电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示
电子发烧友网>电子资料下载>电子论文>移动通信技术论文>采用熵的多维K-匿名划分方法

采用熵的多维K-匿名划分方法

2008-11-20 | rar | 333 | 次下载 | 2积分

资料介绍

K-匿名是数据发布应用场景下重要的隐私保护模型。近年来数据集K-匿名化的算法得到广泛的研究,Median Mondrian算法是目前唯一的多维K-匿名划分方法。文中研究了Median Mondrian算法,指出其不能有效地平衡数据划分精度与数据隐私安全性之间的矛盾,由此提出基于熵测度机制的多维K-匿名划分方法以及评估K-匿名化结果安全性的测量标准。实验表明该算法是可行的,能有效地提高数据安全性。
关 键 词 熵; K-匿名; 多维划分; 准标识符
中图分类号 TP309.2 文献标识码 A
Multidimensional K-anonymity Partition Method Using Entropy
YAN Hua,LIU Gui-song
(Computational Intelligence Laboratory, University of Electronic Science and Technology of China Chengdu 610054)
Abstract K-anonymity is an important privacy preserving model in the data publishing scenario. The algorithms on dataset K-anonymization are researched extensively in recent years, Median Mondrian algorithm is the only multidimensional K-anonymity partition method. However, our research shows that Median Mondrian algorithm is not well-balanced on dealing with the contradiction between data partition precision and data privacy preserving. In this paper, we propose an entropy-based multidimensional K-anonymity partition method and a new evaluation measure on K-anonymization results. The experimental results show that our new method is feasible and preserves the privacy much more efficiently than Median Mondrian algorithm.
Key words entropy; K-anonymity; multidimensional partition; quasi-identifier

近年来,数据的安全与隐私问题已经成为数据挖掘领域研究的重要课题之一。由于个人数据极容易被商业用途的应用收集与分析,所以越来越多的数据拥有者不愿意提供个人信息,除非个人信息中的敏感信息的隐私能得到保障。保护个人隐私信息最直接的方法是将能唯一标识一个人的属性信息(Identifier)隐藏,如姓名和身份证号码。但这种方法无法解决另一种隐私威胁问题,即链接攻击[1]。
链接攻击是指用户通过对发布的数据和其他渠道获得的数据进行链接处理,推演出隐私数据,从而造成隐私泄露。文献[1]提出的K-匿名数据模型正是为了解决链接攻击问题。为了实现数据集的K-匿名化,最有代表性的一类算法[2-4]是通过用户定义的概念层次结构实现K-匿名化,都属于单维的划分方法,其质量取决于使用的概念层次结构。文献[5-6]提出了目前唯一的一个多维K-匿名划分方法,即Median Mondrian算法。实验结果表明该近似的贪心算法能有效地实现数据集的K-匿名化。
K-匿名化后的数据以数值范围替代原始数据的精确值,并且至少有K个数据具有相同的表示,即数据的K-匿名化以损失数据的精确度实现数据的隐私保护。数据的精确度和数据的隐私安全性是相互矛盾的,现有的算法很难在上述两个指标上获得平衡。理想的数据K-匿名化结果应该是在尽可能地减少数据信息损失的情况下,实现数据的隐私安全的最大化。如果两组数据分布具有相同数值范围但数据分布不同,那么数据分布离散程度高的数据安全性高于数据分布相对集中的数据。Median Mondrian算法的设计是在简单满足K-匿名模型要求的前提下,追求数据划分精度的最大化,而在数据隐私安全性方面考虑不够。
熵是最能反映数据点多样性和不确定性的度量机制,因此,基于熵的概念,本文提出一种多维K-匿名划分方法,并针对数据隐私安全性提出新的K-匿名划分结果评价标准。
1 K-匿名模型中的基本概念
K-匿名模型相关概念的定义如下:已知数据集属于一个更大的数据分布12n,拥有属性集12为数据记录的第i个属性,为数据记录t属性[tA的值。
定义 1 标识符(Identifier)。数据集T的标识符I是指能唯一标识数据记录的属性。

下载该资料的人也在下载 下载该资料的人还在阅读
更多 >

评论

查看更多

下载排行

本周

  1. 1电子电路原理第七版PDF电子教材免费下载
  2. 0.00 MB  |  1490次下载  |  免费
  3. 2单片机典型实例介绍
  4. 18.19 MB  |  93次下载  |  1 积分
  5. 3S7-200PLC编程实例详细资料
  6. 1.17 MB  |  27次下载  |  1 积分
  7. 4笔记本电脑主板的元件识别和讲解说明
  8. 4.28 MB  |  18次下载  |  4 积分
  9. 5开关电源原理及各功能电路详解
  10. 0.38 MB  |  11次下载  |  免费
  11. 6100W短波放大电路图
  12. 0.05 MB  |  4次下载  |  3 积分
  13. 7基于AT89C2051/4051单片机编程器的实验
  14. 0.11 MB  |  4次下载  |  免费
  15. 8基于单片机的红外风扇遥控
  16. 0.23 MB  |  3次下载  |  免费

本月

  1. 1OrCAD10.5下载OrCAD10.5中文版软件
  2. 0.00 MB  |  234313次下载  |  免费
  3. 2PADS 9.0 2009最新版 -下载
  4. 0.00 MB  |  66304次下载  |  免费
  5. 3protel99下载protel99软件下载(中文版)
  6. 0.00 MB  |  51209次下载  |  免费
  7. 4LabView 8.0 专业版下载 (3CD完整版)
  8. 0.00 MB  |  51043次下载  |  免费
  9. 5555集成电路应用800例(新编版)
  10. 0.00 MB  |  33562次下载  |  免费
  11. 6接口电路图大全
  12. 未知  |  30320次下载  |  免费
  13. 7Multisim 10下载Multisim 10 中文版
  14. 0.00 MB  |  28588次下载  |  免费
  15. 8开关电源设计实例指南
  16. 未知  |  21539次下载  |  免费

总榜

  1. 1matlab软件下载入口
  2. 未知  |  935053次下载  |  免费
  3. 2protel99se软件下载(可英文版转中文版)
  4. 78.1 MB  |  537791次下载  |  免费
  5. 3MATLAB 7.1 下载 (含软件介绍)
  6. 未知  |  420026次下载  |  免费
  7. 4OrCAD10.5下载OrCAD10.5中文版软件
  8. 0.00 MB  |  234313次下载  |  免费
  9. 5Altium DXP2002下载入口
  10. 未知  |  233046次下载  |  免费
  11. 6电路仿真软件multisim 10.0免费下载
  12. 340992  |  191183次下载  |  免费
  13. 7十天学会AVR单片机与C语言视频教程 下载
  14. 158M  |  183277次下载  |  免费
  15. 8proe5.0野火版下载(中文版免费下载)
  16. 未知  |  138039次下载  |  免费