0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

到底是什么让机器学习达不到我们的期待呢?

nlfO_thejiangme 2018-03-27 13:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习虽然能够在很多地方显示出强大的力量,同时也被集成到了很多的商业流程中去,但它依旧有一些不完美的地方,今天我们就通过一些典型的例子来深刻感受一下机器学习的局限性。

人脸识别

目前最先进的人脸识别系统可以达到99%的准确率。作为使用最为广泛的机器学习算法,人脸识别得到了飞速的发展,但在这背后需要我们对几件事情保持清醒。首先,99%的正确率是来自与验证数据集的测试结果,而验证数据集则来自于与训练数据集相同的数据集,并从中随机抽取。这就意味着数据的均值和方差与训练数据十分相似。但当我们将系统置于真实情况下时,实际照片的特性与训练数据不可能相同,那么实际的精度很有可能低于99%。

模型有时候会将其他的东西识别成人脸(假阳性)或者忘却漏掉了人脸(假阴性)。不同的模型在不同的阶段有着不同的表现,在使用时你需要确定你需要什么样层次的模型,给出多高的精度是可以接受的。在选择权衡算法时,一个模型在检测几千张脸时错检几十张,而另一个模型可以将准确率提高一半但需要10x的处理时间和运算,那么前者将会是不错的选择。剩下的可以交给人类来做,我们对于少量假阳性和假阴性的样本有着非常快的准确识别能力。

下面是几个关于模型训练的数据清理经验。最好的当然是保证每一张脸都可以很容易地看到,没有模糊遮挡,也没有很奇怪的角度。同时图像要保持适度的分辨率,分辨率太高的图像容易引入造成算法失效的噪音。

光学字符识别(OCR)

目前最先进的光学字符识别系统对于文件的识别与排版已经有十分优异。基于边缘检测、计算机视觉与字符识别的技术使得OCR不断改进,对于扫描文档几乎没有障碍了。

但目前OCR还不能够胜任的是非扫描文件的识别,这也是验证码还能作为网站人类识别的功能存在。人类对于字母识别有着无与伦比的能力,无论是模糊、扭曲、颜色不同都不在话下,而计算机望尘莫及。

OCR很有用但对于一些场景下使用不当就会文不对题,下面这张球赛的截频就是一个典型的例子。

上图如果用OCR识别很有可能生成这样的一大串:

[0] PREMIER LEAGUE [1] TOT 2 [2] M [3] U [4] 0 [5] 36:2 [6] 4 [7] SPORTS [8] NEW 0 BUR 0 [9] HALFTIME [10] LIVE [11] NBCSN

如果没有上下文语境我们很难明白识别出的意思,哪里是队名哪里是logo?这会造成很大的混乱。

我们不应该像使用通用OCR一样来直接简单粗暴的套用,而是需要针对情况进行分析。对于上面的例子如果我们想要追踪球员,那么目标追踪的方法会很好,但如果想要追踪比赛分数和时间,那么将OCR限定在固定区域中会是不错的选择。

视 频

视频是一种很神奇的存在,虽然很多机器学习模型能在视频上实现和照片一样的效果,但总会有意想不到的情况。数字世界的解码和封装总是与视频的压缩率和长宽比耦合在一起。

同时考虑到处理时间和算力的限制,对视频进行处理时我们往往选择低分辨的格式。当你选择低分辨率或者较高的压缩时,视频并不会是一组连续的静态图片,所以计算机视觉的识别方法将会与静态图片中的识别方法有很大的差别。

为了说明这一情况我们可以随便点开一个视频并暂停,如下图所示。人们的脸变得模糊、角度和整体形象都显得和静态下十分不同。

下面应该是计算机看到的人脸区域:

你能从中认出图中的主角是谁吗?如果对你来说很困难那么对于计算机来说也不容易!

对于人类来说,在视频中识别人脸很容易,但要把独立的帧抽取出来你会发现图像质量出乎意料的差。

但我们也不能否定机器学习,因为机器学习在大多数情况下对于视频的自动化分类和标注时十分重要的手段。我们需要明白的是我们期望得到的结果以及如何去修正模型实际的表现。如果一个庞大的全球名人识别模型对一段视屏进行检测可能会出现很多假阳性的结果,但是如果使用一个仅仅包含几个著名人士的模型来检测则会得到好得多的结果。如果你的模型表现不好,你还可以从数据的角度来改进,譬如说某个节目中人脸出现的位置就可以作为先验知识来帮助机器提高正确率。我们需要尝试不同的模型和工作流总能取得成功。

如何成功的应用机器学习?

机器学习十分强大,有人将它应用于检测学术造假的论文,也有人将它应用于人脸身份认证、不良内容的裸露检测等。同样也用于为用户推荐商品和服务的推荐引擎上,在这样的场景下假阳性和假阴性的推荐结果不会造成太大影响,事实上一些异常推荐还为用户探索新事物提供了条件。

还有改善搜索引擎的个性化能力,检测农作物动物的疾病以及预测产量等等方面。机器学习将会有无数的应用,我们对它充满期待,但同时也会把握住期待的方向让机器学习正常运转。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人脸识别
    +关注

    关注

    77

    文章

    4129

    浏览量

    88731
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208

原文标题:灵魂拷问:是什么让机器学习达不到我们的期待呢?(开头有个大事儿)

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    手把手教你打造一个专属小智AI机器人,零基础也能玩转AI创客(附详细教程资料及学习路线)

    到底是什么,我们普通人零基础也能怎么动手打造,还有超多好玩的实战项目可以跟着玩。01火遍全网的小智AI,到底是什么?2024年9月小智AI正式开源,短短几个月就登
    的头像 发表于 03-30 14:32 399次阅读
    手把手教你打造一个专属小智AI<b class='flag-5'>机器</b>人,零基础也能玩转AI创客(附详细教程资料及<b class='flag-5'>学习</b>路线)

    强化学习自动驾驶模型学习更快吗?

    是一种机器通过“试错”学会决策的办法。与监督学习不同,监督学习是有人提供示范答案,模型去模仿;而强化
    的头像 发表于 01-31 09:34 817次阅读
    强化<b class='flag-5'>学习</b>会<b class='flag-5'>让</b>自动驾驶模型<b class='flag-5'>学习</b>更快吗?

    MOS管到底是什么?和三极管、继电器有什么本质区别?

    出现的“实力派选手”,常常被与三极管、继电器放在一起比较。不少人在选型时会困惑:MOS管到底是什么?它和我们熟悉的三极管、继电器,核心差异又在哪里?今天就用通俗的语言拆解清楚
    的头像 发表于 01-07 13:46 942次阅读
    MOS管<b class='flag-5'>到底是</b>什么?和三极管、继电器有什么本质区别?

    PCB加工中的“流胶”到底是怎么影响阻抗的?

    是好事,高速先生支持每一个有梦想的人。但是光有梦想肯定控不好阻抗,高速先生一定会把你们摇醒,你们好好思考下到底有什么因素会影响加工的阻抗误差哈! 影响阻抗的因素有很多,高速先生之前文章也写过不少
    发表于 12-23 10:14

    IGBT到底是什么?-从名称入手来带您了解

    对于工作需要用到IGBT、但从未专业学习过IGBT的人来说, IGBT到底是什么、它为什么叫IGBT、它的核心关键词是什么、要怎么理解它 等一系列问题并无法一次性在某个地方获取到,都需要查阅大量的资料,学习大量的基础才能有个初步
    的头像 发表于 11-25 17:38 2521次阅读
    IGBT<b class='flag-5'>到底是</b>什么?-从名称入手来带您了解

    驱动芯片到底有多重要?这些黑科技电子设备飞起来!

    你知道吗? 驱动芯片 就像电子设备的心脏,没有它,你的手机、电脑、智能家电统统都会变成废铁!但这么重要的东西,99%的人却对它一无所知。 驱动芯片到底是什么鬼? 简单来说,驱动芯片就是控制其他
    的头像 发表于 11-25 08:37 559次阅读
    驱动芯片<b class='flag-5'>到底</b>有多重要?这些黑科技<b class='flag-5'>让</b>电子设备飞起来!

    请问Keil中的map文件到底是什么意思?

    Keil中的map文件到底是什么意思?里面是如何进行相关执行操作的
    发表于 11-25 06:59

    单片机和嵌入式,到底是什么关系?

    很多人初次接触嵌入式开发时,都会听到一句话:“嵌入式其实就是单片机。”可当你真正开始学习时,会发现嵌入式和单片机虽然经常“捆绑”在一起提,但它们好像又不是一回事。这篇文章,我们就来厘清这两个概念
    的头像 发表于 11-14 10:28 2027次阅读
    单片机和嵌入式,<b class='flag-5'>到底是</b>什么关系?

    RFID电子标签:生活和工作开挂的神奇科技

    出门过ETC不用停车、超市结账不用挨个扫码、酒店开门不用插钥匙 —— 你有没有发现,这些生活变便捷的场景里,都藏着同一个 “幕后功臣”:RFID电子标签。这个看似不起眼的小技术,早已悄悄渗透到我们
    的头像 发表于 11-13 10:06 845次阅读

    单片机的差分信号到底是什么?

    差分信号到底是什么?通俗来讲,就是驱动端发送两个等值、反相的信号,接收端通过比较这两个电压的差值来判断逻辑状态“0”还是“1”。 差分信号的产生是由输入源发出信号后经过缓冲器和倒相器后,所产生
    发表于 11-12 06:44

    IEC 到底是什么?为什么它能影响全球?

    IEC 到底是什么?为什么它能影响全球?
    的头像 发表于 09-04 17:07 3877次阅读

    晶振的 “负载电容” 到底是什么

    负载电容,到底是什么? 负载电容,简单来说,是指晶振的两条引线连接IC块内部及外部所有有效电容之和,我们可以将其看作晶振片在电路中串接的电容。从更专业的角度讲,它是为了使晶振能够在其标称频率下稳定
    的头像 发表于 07-25 16:26 1190次阅读

    请问编译纯rtos到底是选择Linux+rtos的sdk编译only rtos还是直接使用rtos sdk?

    编译纯rtos到底是选择Linux+rtos的sdk编译only rtos还是直接使用rtos sdk?
    发表于 07-11 07:22

    智能盒子到底是什么东西?昇腾310深度测评:为何能成为行业新宠?

    人摸不着头脑的“智能盒子”。各位搞技术、搞工程的朋友,咱们在工作中是不是经常听到“智能盒子”这个说法?每次听到这个词,我猜很多人心里都在犯嘀咕:这东西到底是个啥玩意儿?难道就是个装了点智能软件的普通盒子?它到底有啥用?能给咱们
    的头像 发表于 04-27 10:46 2059次阅读
    智能盒子<b class='flag-5'>到底是</b>什么东西?昇腾310深度测评:为何能成为行业新宠?

    一文给你讲透!DA板卡到底是什么?它和主板又有哪些不同?

    大家好,我是老王,在电子行业干了十几年,今天我就用“大白话”给大家讲讲DA板卡到底是啥,它和咱们常说的“主板”有啥区别。文章里会穿插一些表格和实际案例,保证你读完不仅能懂,还能跟朋友吹牛!
    的头像 发表于 04-24 16:48 2939次阅读
    一文给你讲透!DA板卡<b class='flag-5'>到底是</b>什么?它和主板又有哪些不同?