资料介绍
聚类分析是将研究对象分为相对同质的群组的统计分析技术,聚类分析的核心就是发现有用的对象簇。K-means聚类算法由于具有出色的速度和良好的可扩展性,一直备受广大学者的关注。然而,传统的K-means算法,未考虑各个属性对于最终聚类结果的影响差异性,这使得聚类的精度有一定的影响。针对上述问题,本文提出一种改进的特征加权算法。改进算法通过采用信息熵和ReliefF特征选择算法对特征进行加权选择,修正聚类对象间的距离函数,使算法达到更准确更高效的聚类效果。仿真实验结果表明,与传统的K-means算法相比,改进后的算法聚类结果稳定,聚类的精度有明显提升。
数据挖掘是目前人工智能和数据库领域研究的热点问题,指从大量的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。聚类分析现在已经成为数据挖掘领域中一个非常重要的研究方向。MacQueen 提出的K-means 算法是聚类分析中最常用的方法之一。它采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。K-means 算法假设样本的每个特征对最终聚类的贡献程度一样,但在实际情况中某些特征在聚类的过程中起到很大的作用,而某些特征的作用却很小,甚至对聚类过程没有影响。
针对传统K-means 算法的这一问题,学者们进行了大量研究,研究表明:通过对特征赋予不同的特征权值,能够有效解决上述问题并提高聚类性能。目前,计算特征权重的算法有很多种:等人提出一种结合限制数据的特征权值量化函数,该函数通过用户指定的限制数据进行特征权值量化并对不同的限制数据赋予不同的置信度,解决了限制数据分布不均匀和限制数据中可能包含不一致性的问题;LiJie 等人提出将针对分类问题的ReliefF 算法应用于聚类问题,通过ReliefF 算法计算特征权重值,并对各维特征进行加权,提高聚类的性能;Meng Qian 等人提出通过梯度下降技术最小化特征评估函数FLearning (w)为每个特征分配权重并进行加权,该算法采用遗传算法和模拟退火算法的优点,减弱冗余特征的影响,解决了容易陷入局部最优解的问题。Songtao Shang 等人提出一种改进的基尼指数算法计算特征权重,该算法克服了原始Gini 的缺点,将条件概率与后验概率结合,抑制训练集不平衡时的影响。利用信息论中的信息熵计算特征权重并对各位特征加权,有效的解决了特征对聚类的影响。
综上所述,为了提高传统K-means 算法的聚类精度,国内外学者对K-means 算法进行了大量改进探索研究,并取得了一些阶段性的成果。本文拟研究传统K-means 算法在聚类过程中聚类对象的每个特征对聚类结果的贡献度,使贡献程度大的特征优先利用,理论上讲可以有效提升K-means 算法聚类的准确率和精度。因此,本文提出将熵值法和ReliefF 特征选择算法有机融合,通过采用信息熵和ReliefF 特征选择算法对特征进行加权选择,修正聚类对象间的距离函数,使算法达到更准确更高效的聚类效果。实验结果表明,改进后的算法聚类结果稳定,且具有较高的准确率,达到预期目的。
- 基于特征和实例迁移的加权多任务聚类算法 3次下载
- 集成簇内和簇间距离的加权k-means聚类方法 1次下载
- 针对高维稀疏数据的可重叠子空间K-Means聚类算法 13次下载
- 基于距离和密度的并行二分K-means算法 17次下载
- 一种改进的聚类联合相似度推荐算法 10次下载
- 如何使用多维网格空间进行改进K-means聚类算法资料概述 1次下载
- 基于改进k-means算法的MANET异常检测方法 0次下载
- 基于聚类集成技术的在线特征选择 0次下载
- 基于改进K_means聚类的欠定盲分离算法_柴文标 0次下载
- 特征加权和优化划分的模糊C均值聚类算法 0次下载
- 混合细菌觅食和粒子群的k_means聚类算法 0次下载
- 基于最小生成树的层次K_means聚类算法 5次下载
- K-means+聚类算法研究综述
- 改进的k-means聚类算法在供电企业CRM中的应用
- 一种增强的K-means聚类算法在入侵检测中的应用
- 基于K-means聚类算法的图像分割 1494次阅读
- 如何在 Python 中安装和使用顶级聚类算法 472次阅读
- 10种顶流聚类算法Python实现(附完整代码) 1259次阅读
- 基于距离的聚类算法K-means的设计实现 2088次阅读
- 基本的k-means算法流程 1.9w次阅读
- PLC常用基本环节梯形图和详细文字说明详细资料概述 8976次阅读
- K-Means算法的简单介绍 4835次阅读
- 变压器保护的基本要求,保护配置和运行规定的详细资料概述 8495次阅读
- 人工智能机器学习之K近邻算法(KNN) 2670次阅读
- Python无监督学习的几种聚类算法包括K-Means聚类,分层聚类等详细概述 3w次阅读
- 一种基于MapReduce模型的并行化k-medoids聚类算法 5208次阅读
- 基于密度DBSCAN的聚类算法 2.1w次阅读
- k means聚类算法实例 1.5w次阅读
- K-means的优缺点及改进 3.1w次阅读
- k-means算法原理解析 8260次阅读
下载排行
本周
- 1TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 2开关电源基础知识
- 5.73 MB | 11次下载 | 免费
- 3嵌入式linux-聊天程序设计
- 0.60 MB | 3次下载 | 免费
- 4DIY动手组装LED电子显示屏
- 0.98 MB | 3次下载 | 免费
- 5基于FPGA的C8051F单片机开发板设计
- 0.70 MB | 2次下载 | 免费
- 651单片机窗帘控制器仿真程序
- 1.93 MB | 2次下载 | 免费
- 751单片机大棚环境控制器仿真程序
- 1.10 MB | 2次下载 | 免费
- 8基于51单片机的RGB调色灯程序仿真
- 0.86 MB | 2次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191186次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多