0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

支持向量机的分类思想

lviY_AI_shequ 来源:未知 作者:李倩 2018-11-23 08:58 次阅读

前言

支持向量机是一种经典的机器学习算法,在小样本数据集的情况下有非常广的应用,我觉得,不懂支持向量机不算是入门机器学习。本篇循序渐进的讲解了支持向量机的分类思想,希望对您有帮助。

目录

1. 函数间隔和几何间隔

2. 支持向量机的分类思想

3. 总结

1. 函数间隔和几何间隔

为了能够更好的阐述支持向量机的分类思想,需要理解函数间隔和几何间隔的定义。

1. 点到超平面的距离

假设超平面方程:

到平面的距离:

由上式可得:没有分类信息,而函数间隔和几何间隔不仅包含了距离信息,还包含了分类信息。

2. 函数间隔和几何间隔

对于给定的训练数据集T,正样本和负样本分别为+1和-1,我们对式(1.1)稍微进行了修改:

(1). 点到平面的距离不作规范化处理,得:

(2). 去掉绝对值符号,并乘以标记结果y0,得:

d2表达式就是函数间隔的定义,有两层含义:大小表示点P0到超平面的距离,正负表示点P0是否正确分类,若d<0,分类错误;反之,则分类正确。

因此,我们定义点到超平面的函数间隔为:

接着定义训练数据集T的函数间隔是所有样本点(xi,yi)的函数间隔的最小值,即:

其中,

但是,若成比例的增加超平面参数w和b,超平面没有改变,但是函数间隔却成比例的增加了,这是不符合理论的,因此,需要对函数间隔进行规范化,得:

(1.7)式就是几何间隔的定义,几何间隔的值是确定的。

2. 支持向量机的分类思想

1. 感知机和logistic回归的分类思想

感知机的损失函数为所有误分类点到超平面的距离之和:

无误分类点时,损失函数为0,满足模型分类条件的超平面有无数个,如下图:

初始超平面为l1,误分类点为红色框,最小化式(2.1)有无穷多个满足损失函数为0的超平面,如上图的l2~ln,然而,最佳分类超平面只有一个,即支持向量机所对应的超平面。

假设logistic回归的模型是,logistic回归的损失函数:

简单分析(2.2)式的分类思想:

(1).当yi=1时,损失函数简化为:

若要使损失函数越小越好,则xi的值越大越好,如下图:

图2.1

往箭头方向移动时,损失函数逐渐变小。

(2). 当yi=0时,损失函数简化为:

若要使损失函数越小越好,则xi的值越小越好,如下图:

当往箭头方向移动时,损失函数逐渐变小。

2. 支持向量机的分类思想

支持向量机结合了感知机和logistic回归分类思想,假设训练样本点(xi,yi)到超平面H的几何间隔为γ(γ>0),由上节定义可知,几何间隔是点到超平面最短的距离,如下图的红色直线:

用logisitic回归模型分析几何间隔:

因此,当γ越大时,损失函数越小,结果为正样本的概率也越大。

因此,感知机的分类思想是最大化点到超平面的几何间隔,这个问题可以表示为下面的约束最优化问题:

根据几何间隔和函数间隔的关系,得几何间隔的约束最优化问题:

函数间隔是样本点到超平面的最短距离,因此,令函数间隔为常数1,那么其他样本点到超平面的距离都大于1,且最大化和最小化是等价的。于是就得到下面的最优化问题:

由(2.8)式和(2.9)式,解得最优解w*,b*,易知最优超平面到正负样本的几何间隔相等(请理解几何间隔的含义,然后仔细回想整个分类过程,就会得到这个结论)。

3. 总结

本文结合了感知机和logistic回归的分类思想来推导支持向量机的最优化问题,即最大间隔分离超平面。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    4327

    浏览量

    62569
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132558

原文标题:支持向量机(一):支持向量机的分类思想

文章出处:【微信号:AI_shequ,微信公众号:人工智能爱好者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于支持向量分类问题

    小菜鸟一枚 ,有哪位大神能提供部分基于支持向量积的分类鉴别问题的MATLAB编码,思路过程,不胜感激
    发表于 04-03 18:54

    如何用支持向量分类器识别手写字体

    sklearn实例-用支持向量分类器(SVC)识别手写字体
    发表于 06-11 17:02

    基于概率投票策略的多类支持向量及应用

    传统的支持向量是基于两类问题提出的,如何将其有效地推广至多类分类仍是一个研究的热点问题。在分析比较现有支持
    发表于 04-01 08:53 12次下载

    改进的支持向量特征选择算法

    针对采用支持向量进行分类的特征子集选择问题,提出一种改进的基于梯度向量的特征评测算法。该算法在核特征空间中,利用数据点到
    发表于 04-03 08:38 19次下载

    基于多分类支持向量的隐写域盲检测

    提出一种区分隐写域(包括像素域、DCT域、DWT域)的盲检测方法,构造图像特征向量,建立一个多分类支持向量,根据特征
    发表于 04-20 09:32 14次下载

    特征加权支持向量

    该文针对现有的加权支持向量(WSVM)和模糊支持向量(FSVM)只考虑样本重要性而没有考虑特
    发表于 11-21 11:15 15次下载

    基于改进支持向量的货币识别研究

    首先,预抽取支持向量以减少训练样本数量,大大缩减训练时间;然后,用缩减后的样本对改进后的分类支持向量
    发表于 12-14 14:57 14次下载

    基于形态小波范数熵和支持向量的电能质量分类研究

    基于形态小波范数熵和支持向量的电能质量分类研究_李梦诗
    发表于 01-07 18:21 0次下载

    大样本支持向量分类策略研究_胡红宇

    大样本支持向量分类策略研究_胡红宇
    发表于 03-19 11:28 0次下载

    分类孪生支持向量研究进展

    孪生支持向量因其简单的模型、快速的训练速度和优秀的性能而受到广泛关注.该算法最初是为解决二分类问题而提出的。不能直接用于解决现实生活中普遍存在的多
    发表于 12-19 11:32 0次下载

    多核学习支持向量应用音乐流派自动分类

    针对不同特征向量下选择最优核函数的学习方法问题,将多核学习支持向量( MK-SVM)应用于音乐流派自动分类中,提出了将最优核函数进行加权组
    发表于 01-09 15:25 2次下载
    多核学习<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>机</b>应用音乐流派自动<b class='flag-5'>分类</b>

    如何从零推导支持向量

    支持向量 (SVM) 是一个非常经典且高效的分类模型。 但是, 支持向量
    发表于 06-10 08:00 1次下载
    如何从零推导<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>机</b>

    OpenCV机器学习SVM支持向量分类程序免费下载

    本文档的主要内容详细介绍的是OpenCV机器学习SVM支持向量分类程序免费下载。
    发表于 10-09 11:45 5次下载

    什么是支持向量 什么是支持向量

    支持向量,英文为Support Vector Machine,简称SV(论文中一般简称SVM)。它是一 种监督式学习的方法,它广泛的应用于统计
    发表于 01-28 16:01 2.2w次阅读
    什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>机</b> 什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b>

    支持向量寻找最优分类超平面的优化问题

    根据,在线性可分情况下,支持向量寻找最优分类超平面的优化问题
    的头像 发表于 05-11 11:13 1580次阅读
    <b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>机</b>寻找最优<b class='flag-5'>分类</b>超平面的优化问题