查重元数据去冗算法设计
大小:0.79 MB 人气: 2018-03-09 需要积分:1
标签:元数据(9107)
随着重复数据删除次数的增加,系统中用于存储指纹索引的清单文件等元数据信息会不断累积,导致不可忽视的存储资源开销。因此,如何在不影响重复数据删除率的基础上,对重复数据删除过程中产生的元数据信息进行压缩,从而减小查重索引,是进一步提高重复数据删除效率和存储资源利用率的重要因素。针对查重元数据中存在大量冗余数据,提出了一种基于压缩近邻的查重元数据去冗算法Dedup2。该算法先利用聚类算法将查重元数据分为若干类,然后利用压缩近邻算法消除查重元数据中相似度较高的数据以获得查重子集,并在该查重子集上利用文件相似性对数据对象进行重复数据删除操作。实验结果表明,Dedup2可以在保持近似的重复数据删除比的基础上,将查重索引大小压缩50%以上。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
查重元数据去冗算法设计下载
相关电子资料下载
- 气象土壤墒情监测站:多元数据融合的智慧农田管理平台 244
- 哥伦比亚大学开发视听工具包,帮助研究者探索神经元数据 275
- 苹果、谷歌曾向政府提供智能手机推送通知,新政执行要求 471
- jvm调优主要是调哪里 948
- 元数据的作用机理是什么?它能解决什么问题? 360
- Linux文件系统层的主要结构 388
- 如何通过注解来优化我们的Java代码 425
- Java中常见的注解 371
- Java中注解的作用 581
- 基于LRU-K模型如何实现高效的元数据缓存? 702