Vladimir Vapnik创立支持向量机-电子发烧友网

在Vladimir Vapnik创立支持向量机前，已有如下结论：在二分类情况中，如果一个数据集线性可分，即存在一个超平面可将两个类别完全分开，那么一定存在无数个超平面将这两个类别完全分开。

在特征空间为二维平面时，分类训练数据的超平面的具体图形为直线，下文介绍在无数个此类直线中选择可使分类效果最优的直线。

一、直观感觉分类效果最优的直线

如图一左图所示，有三条直线可将图一左图中的圆圈和叉分为两类，该三条直线分别为1号线、2号线、3号线。在选择可使圆圈和叉分类效果最优的直线（下文简称“最优分类直线”）时，可能多数人会选择2号线。但根据免费午餐定理，在未假设训练数据的先验分布的情况下，三条直线对于圆圈和叉分类效果相同。人的直观感觉似乎和免费午餐定理产生矛盾。

其实，似乎矛盾的原因是人们在选择最优分类直线时，已对训练样本的先验分布做出假设。例如，多数人选择2号线为最优分类直线可能的假设为训练样本的位置在空间中具有测量误差（选择2号线为最优分类直线的先验分布假设不唯一）。

如图一右图所示，如果红色实线圆圈的位置分布具有测量误差，其实际位置处于虚线圆圈位置，那么1号线的分类效果不如2号线的分类效果；如果红色叉的位置分布具有测量误差，其实际位置处于虚线圆圈位置，那么3号线的分类效果不如2号线的分类效果，即2号线更可抵御训练样本误差，因此，在训练样本的位置在空间中具有测量误差的先验假设下，2号线为最优分类直线。

图一，图片来源：中国慕课大学《机器学习概论》

二、寻找最优分类直线

Vladimir Vapnik基于最优化理论，对寻找最优分类直线的回答如下：任意一条可将圆圈和叉完全分类的直线向一侧平行移动，直至其穿过一侧一个或几个训练样本；再向另一侧平行移动，直至其穿过另一侧一个或几个训练样本。如图二所示，定义被穿过的数据（图二中的红圆圈和叉）为支持向量（Support Vector），定义穿过圆圈和叉的直线间的距离为间隔，则最优分类直线为间隔最大的直线。

图二，图片来源：中国慕课大学《机器学习概论》

根据Vladimir Vapnik的回答，因为前文所述问题中的2号线的间隔最大，所以2号线为最优分类直线。

图片来源：中国慕课大学《机器学习概论》

但仅根据间隔最大不能得出唯一的最优分类直线，例如，前文所述问题中，所有与2号线平行的线均为间隔最大的直线。因此，为可得出唯一直线，最优分类直线被限定处于穿过两侧支持向量的两条直线中间的直线，即最优直线与两侧支持向量的距离相等。

综上，支持向量机寻找的最优分类直线应满足：

（1）该直线可将训练数据完全分为两类。

（2）该直线可最大化间隔。

（3）该直线处于间隔的中间，其与所有支持向量的距离相等。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

向量机

向量机

+关注

关注
0

文章
166

浏览量
20887

原文标题：机器学习相关介绍（7）——支持向量机（解决线性可分问题）

文章出处：【微信号：行业学习与研究，微信公众号：行业学习与研究】欢迎添加关注！文章转载请注明出处。

特征加权支持向量机

该文针对现有的加权支持向量机(WSVM)和模糊支持向量机(FSVM)只考虑样本重要性而没有考虑特

发表于 11-21 11:15 •15次下载

基于改进支持向量机的货币识别研究

首先，预抽取支持向量以减少训练样本数量，大大缩减训练时间；然后，用缩减后的样本对改进后的分类支持向量机进行货币识别，改进后的

发表于 12-14 14:57 •14次下载

支持向量机在电力系统中的应用

20 世纪90 年代由Vapnik 等人提出的基于统计学习理论的支持向量机 (support vector machines, SVM)，是数据挖掘中的一项新技术，它能够对小样本学习

发表于 06-30 18:12 •31次下载

<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>机</b>在电力系统中的应用

基于支持向量机(SVM)的工业过程辨识

将支持向量机应用到典型的时变、非线性工业过程连续搅拌反应釜的辨识中, 并与BP 神经网络建模相比较, 仿真结果表明了支持向量

发表于 03-30 16:12 •42次下载

基于<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>机</b>(SVM)的工业过程辨识

基于标准支持向量机的阵列波束优化及实现

为了考察基于支持向量机算法的波束形成器在实际水声环境中的主瓣宽度、旁瓣级以及阵增益等性能，将标准支持向量

发表于 11-10 11:03 •13次下载

多分类孪生支持向量机研究进展

孪生支持向量机因其简单的模型、快速的训练速度和优秀的性能而受到广泛关注．该算法最初是为解决二分类问题而提出的。不能直接用于解决现实生活中普遍存在的多分类问题．近来，学者们致力于将二分类孪生支持

发表于 12-19 11:32 •0次下载

基于支持向量机的测深激光信号处理

针对浅海探测中激光回波噪声源多、信噪比低，传统非加权最小二乘支持向量机和加权最小二乘支持向量机对

发表于 12-21 13:46 •0次下载

支持向量机的故障预测模型

针对现有的故障预测技术无法从整体上反映系统性能下降趋势等问题，提出一种基于健康度分析的故障预测方法。首先，在支持向量机回归算法基础上构造多输出支持向

发表于 12-29 11:24 •0次下载

关于支持向量机(SVMs)

支持向量机(Support Vector Machine: SVM)是一种非常有用的监督式机器学习算法

发表于 04-02 08:52 •4206次阅读

人工智能之机器学习Analogizer算法－支持向量机（SVM）

支持向量机（SVM）是由Vapnik领导的AT＆T Bell实验室研究小组在1995年提出的一种新的非常有潜力的分类技术。刚开始主要针对二值分类问题而提出，成功地应用子解函数回归及一类

发表于 05-29 19:11 •2056次阅读

介绍七本在注重打好数据科学的数学基础上的技术读物

如果说要列一份关于数学的书单，这本书是绕不过去的。本书单中排名第一的就是俄罗斯著名数学家Vladimir Vapnik的《统计学习理论的本质》。在这份清单中的所有书籍中，Vapnik这本是最不好找的。

发表于 04-19 08:56 •2523次阅读

什么是支持向量机什么是支持向量

支持向量机，英文为Support Vector Machine，简称SV机（论文中一般简称SVM）。它是一种监督式学习的方法，它广泛的应用于统计分类以及回归分析中。

发表于 01-28 16:01 •2.2w次阅读

介绍支持向量机的基础概念

支持向量机（Support Vector Machine）是一种较知名的机器学习算法，该算法由俄罗斯数学家Vladimir Vapnik

发表于 04-28 09:09 •1039次阅读

支持向量机（核函数的定义）

根据机器学习相关介绍（10）——支持向量机（低维到高维的映射），支持向量机可通过引入φ(x)函数

发表于 05-20 10:41 •840次阅读

支持向量机（原问题和对偶问题）

本文主要介绍原问题（PRIME PROBLEM）和对偶问题（DUAL PROBLEM），支持向量机优化问题可通过原问题向对偶问题的转化求解。

发表于 05-25 09:31 •1431次阅读