结合LSH的KNN数据填补算法
大小:0.79 MB 人气: 2017-12-23 需要积分:1
标签:KNN(10751)
K近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希( LSH)的kNN数据填补算法LSH-kNN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之后查找近似最近邻提供索引;其次,针对枚举型、数值型以及混合型缺失数据分别提出对应的局部敏感哈希方法,对每一条待填补的不完整记录进行局部敏感哈希,按得到的哈希值找到与其疑似相似的候选记录;最后在候选记录中通过逐个计算相似度来找到其中相似程度最高的七条记录,并按照kNN算法对不完整记录进行填补。通过在4个真实数据集上的实验表明,结合局部敏感哈希的kNN填补算法LSH-kNN相对经典的kNN算法能够显著提高填补效率,并且保持准确性基本不变。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
结合LSH的KNN数据填补算法下载
相关电子资料下载
- 应用于MEMS执行器的8英寸硅晶圆上的KNN无铅技术介绍 345
- 基于STM32的解魔方机器人设计方案 578
- 机器学习技术之KNN近邻算法编程实例 161
- KNN算法、分类回归树、随机森林的优缺点及应用实例 4258
- 基于训练阶段使用知识库+KNN检索相关信息辅助学习方法 1377
- 如何使用Arduino KNN库进行简单的机器学习? 3316
- 数据科学经典算法 KNN 已被嫌慢,ANN 比它快 380 倍 7141
- 详解机器学习分类算法KNN 5844
- 从零开始学习机器学习最简单的 KNN 算法 2521
- 带你入门常见的机器学习分类算法——逻辑回归、朴素贝叶斯、KNN、SVM、决策树 9873