0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

了解一下适用于每种学习模式的数据集和问题类型

NVIDIA英伟达企业解决方案 来源:未知 作者:李倩 2018-09-06 16:15 次阅读

宜家家具有多种不同的组装方法。在理想情况下,每种方法都可以组装出完整的沙发或椅子。但是,根据细节的不同,每种产品的组装都有最适用的方法。如果拿到说明手册和所有正确的零件,就只需按照指示操作即可。如果你已经找到了窍门,不妨把手册扔到一边,试试独自操作。

深度学习也是如此。基于可用数据的类型和正在研究的问题,科学家将选择特定的学习模型来训练算法

在监督式学习模型中,算法基于有标记的数据集进行学习,同时数据集提供答案,算法可利用该答案来评估其在训练数据方面的准确性。相比之下,无监督式模型使用的是无标记数据,算法需要自行提取特征和规律来理解这些数据。半监督式学习居于二者之间:这种方法使用少量有标记的数据来支持大量无标记数据。

增强学习模型一般用来训练带有奖励系统的算法。在特定情况下,如果AI Agent执行了最佳的操作,增强学习模型会提供一定反馈。

下面我们来了解一下适用于每种学习模式的数据集和问题类型。

什么是监督式学习?

如果您在别人的监督之下学习,有人会当场评判您是否得出了正确答案。同样,在监督式学习中,训练算法时同样需要一整套带有标记的数据。

完全标记意味着训练数据集中的每个示例都标记相对应的答案。因此,一个由花朵图像组成的有标记数据集会告知模型哪些图片是玫瑰、哪些图片是雏菊或者水仙。在“看到”新图像时,模型会将其与训练示例进行比较,以给出正确的标记。

在监督式机器学习中,算法需要通过有标记的数据进行学习。

监督式学习有两个主要的应用领域:分类问题和回归问题。

分类问题要求算法可以预测离散值,将输入数据标识为特定类或组的成员。在由动物图像组成的训练数据集中,这意味着每张照片已被预先标记为猫、考拉或海龟等。然后,算法的评估标准为,算法对其他考拉和海龟的新图像进行分类的准确程度。

上图显示的是猫、考拉还是海龟?分类算法可以区分差异。

回归问题则要求算法基于连续数据。比如线性回归:给出一个特定的x值,求y变量的值。

更贴近现实的机器学习示例涉及许多变量,例如根据建筑面积、位置和距离公共交通的远近来预测旧金山公寓价格的算法。

因此,监督式学习最适合具有一系列可用参考点或真实值来训练算法的问题。但那些数据并不总是现成可用的。

什么是无监督式学习?

清晰、完美标记的数据集并不容易获得。有时,研究人员会向算法询问一些他们未知的问题。而这正是无监督式学习可以发挥作用的地方。

在无监督式学习中,深度学习模型会收到某个数据集,但对于如何处理该数据集却未获得明确的指示。训练数据集是没有特定预期结果或正确答案的示例的集合。然后,神经网络尝试通过提取有用的特征并分析其结构来自动发现数据结构。

无监督式学习模型自动提取特征并在数据中找到规律。

根据所研究的问题,无监督式学习模型可以用不同的方式组织数据。

聚类:即使不是专业的鸟类学家,我们也可以观察一系列鸟类照片,并根据其羽毛的颜色、体态的大小或喙形等线索,对照片进行粗略的对比分类。这正是聚类这一无监督式学习的最常见应用类型的运作方式:深度学习模型寻找相似的训练数据并将它们分为一组。

异常检测:银行通过寻找客户购买行为中不寻常的模式来侦查欺诈交易。例如,如果同一张信用卡于同一天在加利福尼亚和丹麦使用,那就会引起怀疑。同理,无监督式学习还可用来标记数据集中的异常值。

关联:如果您的网上购物车里有尿布、苹果酱和吸管杯,网站可能会建议您在订单中添加围嘴和婴儿监视器。这是一个关联示例,其中数据样本的某些特征与其他特征相关联。通过查看某个数据的几个关键属性,无监督式学习模型可以预测它们通常关联的其他属性。

自动编码器:自动编码器会接收输入数据,将其压缩为代码,然后设法使用这些汇总结的代码重新创建输入数据。这就像从《白鲸记》开始,创建SparkNotes版本,然后设法使用SparkNotes重写原始故事,并作为参考。虽然这是一项简便易行的深度学习技巧,但让简单的自动编码器发挥作用的现实用例却很少。但是,如果增添一层复杂性,自动编码器的使用效果就会成倍增加:通过在训练期间同时使用杂乱版本和整洁版本的图像,自动编码器可以消除图像、视频或医学扫描图等视觉数据中的杂点,从而提高图像质量。

由于数据中不存在“真值”元素,因此很难衡量使用无监督式学习训练的算法的准确性。但在许多研究领域中,有标记数据要么难以获得,要么过于昂贵。在这些情况下,允许深度学习模型完全自由地寻找相关规律,可以产生高质量的结果。

什么是半监督式学习?

可以将半监督式学习视为一种折衷办法。

在很大程度上,半监督式学习的含义正如其名:同时含有标记数据和无标记数据的训练数据集。在从数据中提取相关特征存在困难以及标记示例对专家来说非常耗时的情况下,这种方法特别有用。

半监督式学习对于医学影像尤其有用,在此类影像中,少量有标记数据可以显著提高准确性。

这类学习的常见应用情境是CT扫描或核磁共振成像 (MRI) 等医学影像。受过培训的放射科医生可以检查并标记肿瘤或疾病的一小部分扫描结果。但是,手动标记所有扫描结果会花费大量的时间和成本。不过与完全无监督式模型相比,半监督式学习中的深度学习网络仍然可以从小比例的有标记数据中受益,并提高其数据的准确性。

一种热门的训练方法是从一小组有标记数据开始训练,并使用生成式对抗网络 (GAN)。

处于竞争状态的两个深度学习网络都试图超越对方,这就是 GAN。其中一个网络名为生成器(generator),试图创建新数据点来模拟训练数据。另一个网络名为鉴别器(discriminator),它会接收这些新生成的数据,并评估它们是训练数据的一部分还是虚假数据。由于鉴别器可越来越准确地区分虚假数据和原始数据,生成器则提高了其生成令人信服的虚假数据的能力,两种网络在正反馈回路中得到改善。

这就是 GAN 的工作原理:标记为“D”的鉴别器显示来自生成器“G”和训练数据集的图像。鉴别器的任务是确定来自生成器的图像哪些是真实的、哪些是虚假的。

什么是增强学习?

视频游戏中充满了增强提示:通过一关即可获得一个徽章;使用一定数量的动作击败坏人即可赢得奖金;倘若不慎落入陷阱,则游戏结束。

这些提示可帮助玩家学习如何在下一局游戏中有更好的表现。如果没有这些反馈,他们只会在游戏环境中采取随机行动。

增强学习的运作原理与此相同,而视频游戏则是这类研究的日常测试环境。

在这种机器学习中,AI Agent试图找到实现特定目标的最佳方式或改进特定任务的最优方法。当Agent采取的行动有助实现目标时,它会获得奖励。总体目标是预测下一步要采取的最佳措施以获得最终大奖。

Agent可以从过去的反馈中吸取教训,并探索可能带来更大收益的新策略,从而做出选择。当然,正如国际象棋比赛中短期的移动可能无法助您长远获得胜利一样,Agent也会制定长期战略计划,最大限度地提高累积的奖励。

这是一个迭代的过程:反馈次数越多,Agent制定的策略就会越好。这种技术对于训练机器人特别有用,机器人要在诸如控制自动驾驶汽车或管理仓库中的库存等任务中做出一系列决策。

其实每种算法都有不同的学习方式,您只需选择最佳方式来帮助神经网络掌握诀窍即可。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4762

    浏览量

    100519
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24635
  • 深度学习
    +关注

    关注

    73

    文章

    5491

    浏览量

    120958

原文标题:监督式学习、无监督式学习、半监督式学习和增强学习之间有何区别?

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    了解一下每种开关中存在的不同电路

    开关是电子设备不可或缺的部分。几乎每个电子设备中都有个开关,有时甚至有好几个。这是因为设备在使用时往往存在多种工作模式。最明显的模式普是接通或断开,但往往有
    的头像 发表于 07-03 09:29 6713次阅读
    <b class='flag-5'>了解</b><b class='flag-5'>一下</b><b class='flag-5'>每种</b>开关中存在的不同电路

    适用于任意数据模态的自监督学习数据增强技术

    本文提出了适用于任意数据模态的自监督学习数据增强技术。   自监督学习算法在自然语言处理、计
    的头像 发表于 09-04 10:07 1060次阅读
    <b class='flag-5'>适用于</b>任意<b class='flag-5'>数据</b>模态的自监督<b class='flag-5'>学习</b><b class='flag-5'>数据</b>增强技术

    适用于STM32芯片的开发教程

    安富莱的论坛上也有很多有关单片机方面的有用的资料,大家可以参考。本文不仅适用于STM32芯片的开发,也适用于其它芯片。正文学习款新的芯片,需要大家从官方获取两方面的资料,
    发表于 12-09 06:54

    适用于NFC和验证的子系统设计

    描述 此参考设计是适用于 NFC(近场通信)和验证的子系统设计。该子系统设计旨在用作参考设计,支持部件认证、访问控制、个人识别、无电池传感器接口、安全令牌传输和本地数据的低功耗传输。在诸多系统
    发表于 09-22 09:15

    钮扣电池都有哪些类型分别适用于哪些设备?

    钮扣电池都有哪些类型分别适用于哪些设备? 钮扣电池类型 特性 应用设备  1.氧化银电池:高且稳定的电压自放电每年5% 手表照相机
    发表于 11-05 09:47 1034次阅读

    科普一下:机器学习和深度学习的区别和关系

    深度学习属于机器学习个子域,其相关算法受到大脑结构与功能(即人工神经网络)的启发。深度学习如今的全部价值皆通过监督式学习或经过标记的
    发表于 06-23 12:25 8.1w次阅读
    科普<b class='flag-5'>一下</b>:机器<b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>的区别和关系

    宏碁智能佛珠了解一下

    朋友,最近工作顺利吗?家庭幸福吗?生活美满吗?看你心情复杂,要不要了解一下宏碁刚发布的智能佛珠?
    的头像 发表于 08-08 16:27 3531次阅读

    了解一下机器学习中的基础知识

    ,那么机器学习的基础知识都有哪些呢?本文给大家列举一下机器学习的基础知识。 (1)准确率的概念,准确率就是分类模型预测准确的比例。 (2)AUC(曲线下面积)则是种考虑到所有可能的分
    的头像 发表于 03-31 17:08 3788次阅读

    适用于命名数据网络的缓存内容分类模型

    的 Diffserv模型,提出适用于NDN的缓存内容分类模型,并给出同时考虑内容分类、路由器本地流行度和内容下载时延的概率缓存算法 Diffcache。实验结果表明,该算法可实现缓存资源的动态分配,在不影响全局命中率和下载时延的情况
    发表于 05-12 11:33 4次下载

    适用于模式识别的新型神经网络

    提出了适用于模式识别的新型神经网络模型——局部有监督特征映射网络,描述了该网络的拓扑结构和学习算法,研究了网络的基本性能,最后将其应用到了质量控制图的
    发表于 05-31 16:29 5次下载

    适用于汽车应用的开关峰值电流模式控制电路优化技术

    适用于汽车应用的开关峰值电流模式控制电路优化技术
    发表于 11-07 08:07 0次下载
    <b class='flag-5'>适用于</b>汽车应用的开关峰值电流<b class='flag-5'>模式</b>控制电路优化技术

    了解一下“薄膜厚度监控”

    光学镀膜干货来了!了解一下“薄膜厚度监控”
    的头像 发表于 07-20 10:11 826次阅读
    <b class='flag-5'>了解</b><b class='flag-5'>一下</b>“薄膜厚度监控”

    精密平台激光焊接机适用于哪些场景使用

    平台激光焊接机是比较常见的种激光焊接设备。本篇我们就来了解一下它究竟适用于哪些行业场景。平台激光焊接机与大家非常熟悉的手持激光焊接机,无论是在结构设计上,还是在
    的头像 发表于 10-26 13:43 944次阅读
    精密平台激光焊接机<b class='flag-5'>适用于</b>哪些场景使用

    增量式编码器3大特点,工作模式,精度,输出脉冲信号 一起了解一下

    增量式编码器3大特点,工作模式,精度,输出脉冲信号...一起了解一下吗?在现代工业自动化和控制系统中,增量式编码器扮演着至关重要的角色。它可以将机械运动转化为电信号,为各类设备提供精确的位置和速度
    的头像 发表于 08-15 14:20 531次阅读
    增量式编码器3大特点,工作<b class='flag-5'>模式</b>,精度,输出脉冲信号 <b class='flag-5'>一起了解</b><b class='flag-5'>一下</b>吗

    光电式传感器有几种类型适用于哪些检测控制场合

    光电式传感器是种将光信号转换为电信号的装置,广泛应用于自动化控制、机器人技术、医疗设备、安全监控等领域。由于光电式传感器的种类繁多,每种类型的传感器都有其特定的应用场景和优势。 1. 光电开关
    的头像 发表于 09-23 09:18 802次阅读