资料介绍
提出了一种多密度网格聚类算法GDD。该算法主要采用密度阈值递减的多阶段聚类技术提取不同密
度的聚类,使用边界点处理技术提高聚类精度,同时对聚类结果进行了人工干预。GDD 算法只要求
对数据集进行一遍扫描。实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好
的识别出孤立点或噪声,在处理多密度聚类方面有很好的精度。
关键词:密度阈值递减;多阶段聚类;边界点提取
聚类是数据挖掘中的一种重要技术,它的目标是将数据集分成若干个子集,同一个子集
中的对象是相似的,不同子集中的对象不相似。在几何方面,聚类是在整个数据集中确定由
稀疏区域分开的密集区域。由于其无指导学习能力,聚类算法能在数据集中发现隐藏的数据模式,所以对聚类算法的研究一直很活跃。基于相似性已经有很多聚类算法,这些聚类算法大体上可分为基于划分的聚类算法、基于密度的聚类算法、基于层次的聚类算法和基于网格的聚类算法等。其中基于网格的聚类算法由于只考虑网格单元而不是考虑每个点,它的计算效率比较高。基于网格的聚类算法认为:当网格划分的比较细时,每个网格内的点可看作是相似的。但是对多密度的数据集,这些算法很难得到满意的聚类结果。本文的主要目的就是利用网格技术解决对多密度数据集的聚类。
聚类分析所使用的数据集中,各个类的密集往往不尽相同,甚至差别很大。大多数现有
的聚类算法都是致力于如何发现任意形状和大小的类,但很难有效的处理密度差别较大的数据集。能够处理多密度数据集的聚类算法有Chameleon[1]、共享近邻SNN 算法[2]、多阶段等密度线算法[3]等。
Chameleon 算法可以用来处理多密度的数据集,但当数据集较大时其算法的时间复杂度
太高。共享近邻SNN 算法的主要思想是:对于数据集中每个点,找出距离其最近的K 个邻近点,形成一个集合。然后考虑数据集中的任意两个点,若对应于这两个点的K 个邻近点集合交集部分的点数超过一个阈值,则将这两个点归于一类。SNN 算法的优点是可以对不同密度和形状的数据集进行聚类,缺点是在多密度聚类和处理孤立点或噪声方面精度都不高(见图1(a)和图2(a))。多阶段等密度线算法采用多阶段的方式,利用等密度线的思想对数据集进行聚类,它的缺点是不能有效地分离出多个类。文献[2]给出了SNN 算法和一些现有的聚类算法的比较结果,结果表明SNN 算法表现出了较好的性能。本文只给出GDD 算法和SNN 算法聚类结果的比较,从比较结果可以看出GDD 算法在多密度聚类、孤立点或噪声处理方面显示出了很高的精度。
现有的聚类算法大都忽视了聚类过程中的人工参与,很难在聚类过程中充分利用专家
关于领域的知识指导聚类过程,所以得不到满意的聚类结果。在GDD 算法中,对聚类结果就进行了人工干预。
度的聚类,使用边界点处理技术提高聚类精度,同时对聚类结果进行了人工干预。GDD 算法只要求
对数据集进行一遍扫描。实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好
的识别出孤立点或噪声,在处理多密度聚类方面有很好的精度。
关键词:密度阈值递减;多阶段聚类;边界点提取
聚类是数据挖掘中的一种重要技术,它的目标是将数据集分成若干个子集,同一个子集
中的对象是相似的,不同子集中的对象不相似。在几何方面,聚类是在整个数据集中确定由
稀疏区域分开的密集区域。由于其无指导学习能力,聚类算法能在数据集中发现隐藏的数据模式,所以对聚类算法的研究一直很活跃。基于相似性已经有很多聚类算法,这些聚类算法大体上可分为基于划分的聚类算法、基于密度的聚类算法、基于层次的聚类算法和基于网格的聚类算法等。其中基于网格的聚类算法由于只考虑网格单元而不是考虑每个点,它的计算效率比较高。基于网格的聚类算法认为:当网格划分的比较细时,每个网格内的点可看作是相似的。但是对多密度的数据集,这些算法很难得到满意的聚类结果。本文的主要目的就是利用网格技术解决对多密度数据集的聚类。
聚类分析所使用的数据集中,各个类的密集往往不尽相同,甚至差别很大。大多数现有
的聚类算法都是致力于如何发现任意形状和大小的类,但很难有效的处理密度差别较大的数据集。能够处理多密度数据集的聚类算法有Chameleon[1]、共享近邻SNN 算法[2]、多阶段等密度线算法[3]等。
Chameleon 算法可以用来处理多密度的数据集,但当数据集较大时其算法的时间复杂度
太高。共享近邻SNN 算法的主要思想是:对于数据集中每个点,找出距离其最近的K 个邻近点,形成一个集合。然后考虑数据集中的任意两个点,若对应于这两个点的K 个邻近点集合交集部分的点数超过一个阈值,则将这两个点归于一类。SNN 算法的优点是可以对不同密度和形状的数据集进行聚类,缺点是在多密度聚类和处理孤立点或噪声方面精度都不高(见图1(a)和图2(a))。多阶段等密度线算法采用多阶段的方式,利用等密度线的思想对数据集进行聚类,它的缺点是不能有效地分离出多个类。文献[2]给出了SNN 算法和一些现有的聚类算法的比较结果,结果表明SNN 算法表现出了较好的性能。本文只给出GDD 算法和SNN 算法聚类结果的比较,从比较结果可以看出GDD 算法在多密度聚类、孤立点或噪声处理方面显示出了很高的精度。
现有的聚类算法大都忽视了聚类过程中的人工参与,很难在聚类过程中充分利用专家
关于领域的知识指导聚类过程,所以得不到满意的聚类结果。在GDD 算法中,对聚类结果就进行了人工干预。
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- 基于群组和密度的大规模轨迹聚类算法 2次下载
- 基于网格多密度聚类的古建筑图像特征匹配方法 3次下载
- 一种基于自然最近邻的密度峰值聚类算法 12次下载
- 基于MapReduce和加权网络信息熵的DBWGIE-MR算法 11次下载
- 一种自适应的关联融合聚类算法 13次下载
- 基于核诱导的不完整多视觉聚类算法KIMV 5次下载
- 可检测出租车载客的轨迹聚类算法 13次下载
- 如何使用拉普拉斯中心性和密度峰值进行无参数聚类算法的研究 12次下载
- 如何融合密度峰值进行高斯混合模型聚类算法概述 2次下载
- 如何使用多维网格空间进行改进K-means聚类算法资料概述 1次下载
- 聚类算法及聚类融合算法研究 33次下载
- 基于网格的带有参考参数的聚类算法
- 基于搜索机制密度聚类的支持向量预选取算法
- 基于模糊聚类思想的网格独立任务调度算法
- 基于不均匀密度的自动聚类算法
- 使用轮廓分数提升时间序列聚类的表现 398次阅读
- 一文弄懂数据挖掘的十大算法,数据挖掘算法原理讲解 912次阅读
- 如何在 Python 中安装和使用顶级聚类算法 472次阅读
- 代码实现密度聚类DBSCAN 593次阅读
- 10种顶流聚类算法Python实现(附完整代码) 1259次阅读
- 10种聚类介绍和Python代码 2850次阅读
- 基于距离的聚类算法K-means的设计实现 2088次阅读
- 浅析四类机器学习在自动驾驶中的应用 5329次阅读
- 关于TD Learning算法的分析 1829次阅读
- Python无监督学习的几种聚类算法包括K-Means聚类,分层聚类等详细概述 3w次阅读
- 机器学习中五种常用的聚类算法 3.8w次阅读
- 浅谈Matlab中的聚类分析 Matlab聚类程序的设计 7212次阅读
- 一种基于MapReduce模型的并行化k-medoids聚类算法 5208次阅读
- 基于密度DBSCAN的聚类算法 2.1w次阅读
- k means聚类算法实例 1.5w次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB | 1490次下载 | 免费
- 2单片机典型实例介绍
- 18.19 MB | 93次下载 | 1 积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB | 27次下载 | 1 积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB | 18次下载 | 4 积分
- 5开关电源原理及各功能电路详解
- 0.38 MB | 10次下载 | 免费
- 6基于AT89C2051/4051单片机编程器的实验
- 0.11 MB | 4次下载 | 免费
- 7基于单片机和 SG3525的程控开关电源设计
- 0.23 MB | 3次下载 | 免费
- 8基于单片机的红外风扇遥控
- 0.23 MB | 3次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB | 66304次下载 | 免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB | 51209次下载 | 免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB | 51043次下载 | 免费
- 5555集成电路应用800例(新编版)
- 0.00 MB | 33562次下载 | 免费
- 6接口电路图大全
- 未知 | 30320次下载 | 免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB | 28588次下载 | 免费
- 8开关电源设计实例指南
- 未知 | 21539次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935053次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537791次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191183次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183277次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138039次下载 | 免费
评论
查看更多