常见的几种聚类算法-电子发烧友网

目前，聚类算法被广泛应用于用户画像、广告推荐、新闻推送和图像分割等等。聚类算法是机器学习中一种“数据探索”的分析方法，它帮助我们在大量的数据中探索和发现数据的结构。那么机器学习中的聚类算法有哪几种呢？下面我将为大家一一介绍常见的几种聚类算法，分别是高斯聚类模型、基于密度的聚类算法、凝聚层次聚类和均值漂移算法。

1、高斯聚类模型

事实上，GMM 和 k-means 很像，不过 GMM 是学习出一些概率密度函数来，简单地说，k-means 的结果是每个数据点被 assign 到其中某一个 cluster 了，而 GMM 则给出这些数据点被 assign 到每个 cluster 的概率，又称作 soft assignment 。

2、基于密度的聚类算法

基于密度的聚类算法最大的优点在于无需定义类的数量，其次可以识别出局外点和噪声点、并且可以对任意形状的数据进行聚类。DBSCAN同样是基于密度的聚类算法，但其原理却与均值漂移大不相同：首先从没有被遍历的任一点开始，利用邻域距离epsilon来获取周围点；如果邻域内点的数量满足阈值则此点成为核心点并以此开始新一类的聚类；其邻域内的所有点也属于同一类，将所有的邻域内点以epsilon为半径进行步骤二的计算；重复步骤二、三直到变量完所有核心点的邻域点；此类聚类完成，同时又以任意未遍历点开始步骤一到四直到所有数据点都被处理；最终每个数据点都有自己的归属类别或者属于噪声。

3、K均值聚类

这一最著名的聚类算法主要基于数据点之间的均值和与聚类中心的聚类迭代而成。它主要的优点是十分的高效，由于只需要计算数据点与剧类中心的距离，其计算复杂度只有O（n）。其工作原理主要分为以下四步：首先我们需要预先给定聚类的数目同时随机初始化聚类中心。我们可以初略的观察数据并给出较为准确的聚类数目；每一个数据点通过计算与聚类中心的距离了来分类到最邻近的一类中；根据分类结果，利用分类后的数据点重新计算聚类中心；重复步骤二三直到聚类中心不再变化。

4、凝聚层次聚类

层次聚类法主要有自顶向下和自底向上两种方式。其中自底向上的方式，最初将每个点看作是独立的类别，随后通过一步步的凝聚最后形成独立的一大类，并包含所有的数据点。这会形成一个树形结构，并在这一过程中形成聚类。

5、均值漂移算法

这是一种基于滑动窗口的均值算法，用于寻找数据点中密度最大的区域。其目标是找出每一个类的中心点，并通过计算滑窗内点的均值更新滑窗的中心点。最终消除临近重复值的影响并形成中心点，找到其对应的类别。其工作原理主要是以下几点：首先以随机选取的点为圆心r为半径做一个圆形的滑窗。其目标是找出数据点中密度最高点并作为中心；在每个迭代后滑动窗口的中心将为想着较高密度的方向移动；连续移动，直到任何方向的移动都不能增加滑窗中点的数量，此时滑窗收敛；将上述步骤在多个滑窗上进行以覆盖所有的点。当过个滑窗收敛重叠时，其经过的点将会通过其滑窗聚类为一个类。

以上就是机器学习中常见的五种聚类算法，大家都了解了吗？如果还想深入学习聚类算法的相关内容，比如原理、算法效果的衡量标准以及基于Kmeans算法进行改进的优化方法，可以上博学谷官网进行有关课程的在线学习。希望大家通过课程可以学会使用聚类算法进行数据分析，挖掘商业价值。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4612

浏览量
92886
聚类

聚类

+关注

关注
0

文章
146

浏览量
14212
机器学习

机器学习

+关注

关注
66

文章
8418

浏览量
132628

常见的加密算法有哪些？它们各自的优势是什么？

常见的加密算法及其优势如下： AES（Advanced Encryption Standard）： AES是一种对称加密算法，采用分组密码体制，支持128位、192位和256位密钥长度。AES的优势

发表于 12-17 15:57 •106次阅读

常见的lvs负载均衡算法

常见的lvs负载均衡算法包括轮询(RR)、加权轮询(WRR)、最小连接(LC)、加权最小连接(WLC)、基于局部性的最少链接(LBLC)、带复制的LBLC(LBLCR)、目标地址散列(DH)、源地址

发表于 12-12 13:50 •77次阅读

CAN总线十万个为什么 | 聊聊几种常见的CAN网络拓扑

来到《CAN总线十万个为什么》系列视频。今天我们聊聊几种常见的CAN网络拓扑，主要有：线型拓扑、星型拓扑、环形拓扑和树形拓扑。1.线型拓扑线型拓扑，也称为总线型拓扑，

发表于 11-21 01:03 •501次阅读

CAN总线十万个为什么 | 聊聊<b class='flag-5'>几种</b><b class='flag-5'>常见</b>的CAN网络拓扑

几种常见的控制方法及其优缺点

。温度控制系统是变参数、有时滞和随机干扰的动态系统，为达到满意的控制效果，具有许多控制方法。故对几种常见的控制方法及其优缺点进行了分析与比较。

发表于 11-09 09:57 •763次阅读

<b class='flag-5'>几种</b><b class='flag-5'>常见</b>的控制方法及其优缺点

人员轨迹分析算法有哪些？

时段等。这些信息可以对城市规划、交通管理、公共安全等方面具有重要的指导意义。而为了实现人员轨迹分析，我们需要使用一些专门的算法和技术。下面是几种常用的人员轨迹分析算法： 1. 基于密度的聚

发表于 09-26 10:42 •399次阅读

机器学习算法原理详解

机器学习作为人工智能的一个重要分支，其目标是通过让计算机自动从数据中学习并改进其性能，而无需进行明确的编程。本文将深入解读几种常见的机器学习算法原理，包括线性回归、逻辑回归、支持向量机（SVM）、决策树和K近邻（KNN）

发表于 07-02 11:25 •1038次阅读

A类和B类功放哪个更好

在音频放大领域，A类（甲类）和B类（乙类）功放作为两种常见的放大技术，各自具有独特的优势和适用场景。本文旨在深入探讨A类和B类功放的性能特点

发表于 05-31 18:11 •5308次阅读

功率放大器的几种常见类型

功率放大器，简称功放，是音响系统中的重要组成部分，其主要作用是将音频信号放大，以驱动扬声器发出更大的声音。在音频领域，功率放大器的种类繁多，各具特色。本文将对功率放大器的几种常见类型进行详细介绍

发表于 05-23 16:03 •3015次阅读

STM32单片机有哪几种常见的开发环境？

STM32单片机是一款广泛应用于嵌入式系统开发的单片机，针对其开发，有以下几种常见的方式：STM32单片机有哪几种常见的开发环境？KeilMDK是一款广泛使用的单片机集成开发环境，支持

发表于 05-18 08:04 •3078次阅读

介绍几种常见的e-PTFE防水透气膜型号和规格

大家好，我是微尔斯科技的VILI专注于高分子微孔材料的研发、应用与推广e-PTFE防水透气膜是一种广泛应用于各种领域的高分子微孔材料，其型号和规格繁多，各具特色。下面，我们将详细介绍几种常见

发表于 05-07 08:08 •956次阅读

基于FPGA的常见的图像算法模块总结

意在给大家补充一下基于FPGA的图像算法基础，于是讲解了一下常见的图像算法模块，经过个人的总结，将知识点分布如下所示。

发表于 04-28 11:45 •598次阅读

聊一下常见的几种无线遥控器及其可能使用的晶振频率

无线遥控器可以分为四种类型，其中每种类型可能采用不同的频率晶振。今天KOAN凯擎小妹聊一下常见的几种无线遥控器及其可能使用的晶振频率。

发表于 03-22 14:29 •4667次阅读

java实现多线程的几种方式

了多种实现多线程的方式，本文将详细介绍以下几种方式： 1.继承Thread类 2.实现Runnable接口 3.Callable和Future 4.线程池 5.Java 8中

发表于 03-14 16:55 •708次阅读

浪涌保护器常见的几种抑制器件特点及应用领域

浪涌保护器常见的几种抑制器件特点及应用领域浪涌保护器是一种用于保护电器设备免受过电压和过电流的损害的装置。而抑制器件是浪涌保护器的重要组成部分，用于抑制电压和电流的浪涌。下面将详细介绍几种

发表于 02-19 09:25 •963次阅读

常用的角速度传感器包括几种类型

常用的角速度传感器包括几种类型常用的角速度传感器包括以下几种类型： 1. 陀螺仪：陀螺仪是最常见的角速度传感器之一。它通过测量旋转物体相对于某个参考点的角速度来确定旋转物体的角度变化。其中最

发表于 01-03 17:13 •1493次阅读

搜索历史

常见的几种聚类算法

评论

常见的加密算法有哪些？它们各自的优势是什么？

常见的lvs负载均衡算法

CAN总线十万个为什么 | 聊聊几种常见的CAN网络拓扑

几种常见的控制方法及其优缺点

人员轨迹分析算法有哪些？

机器学习算法原理详解

A类和B类功放哪个更好

功率放大器的几种常见类型

STM32单片机有哪几种常见的开发环境？

介绍几种常见的e-PTFE防水透气膜型号和规格

基于FPGA的常见的图像算法模块总结

聊一下常见的几种无线遥控器及其可能使用的晶振频率

java实现多线程的几种方式

浪涌保护器常见的几种抑制器件特点及应用领域

常用的角速度传感器包括几种类型