0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习没有捷径可循

电子工程师 来源:工程师曾玲 2019-05-02 15:01 次阅读

O'Reilly最新的调查数据显示,大数据仍然只是1%,或者15%的企业游戏。大多数的企业(85%)依然没有破解AI机器学习的密码。仅仅只有15%的“见多识广”的企业在生产过程中运行一些数据模型超过了5年。更重要的是,这些企业更倾向于在一些重要的领域花费时间和精力,比如模型偏差和数据隐私。相对而言,那些还属于初学者之列的企业仍然还在努力尝试着寻找启动按钮。

不幸的是,对于那些希望通过自动快捷方式比如Google的AutoML或者通过聘请咨询公司缩小数据科学差距的企业,我们给出的答案是:实现数据科学的确需要花费时间,而且没有捷径可循。

聪明的企业专注于深层次数据

首先,值得注意的是,O'Reilly的调查数据来自于其自选的一群人:那些曾经参加过O'Reilly活动的,或者参加过该公司在线研讨会或通过其他途径与之有接触的人。这些人群对于数据科学都有前瞻性的兴趣,即使(按照调查数据的显示)他们中的大部分人并没有从事太多的相关工作。对于那些沉浸在大数据体验中的人来说,最好的客户群体就是那些被称为“见多识广”的企业,它们在生产过程中使用的数据模型已经运行了5年以上。

从调查上可以发现一个有趣的现象,那就是这些企业是怎样称呼他们自己的数据专家的。具有丰富数据经验的企业称之为数据科学家。而那些思维尚停留在上世纪90年代“数据挖掘”模式的企业则更倾向于称其为“数据分析师”。如下图所示。

机器学习没有捷径可循

调查发现,无论企业选择如何称呼他们的数据专家,企业在AI和机器学习方面的经验越丰富,他们就越有可能依靠内部数据科学团队建立模型,如下图所示。

机器学习没有捷径可循

几乎没人关注云机器学习服务(至少现在还没有)。那些只有2年以下生产经验的企业倾向于依赖外部的顾问来搭建机器学习模型。对于这样的企业而言,这种感觉就像一种不用投入人力而享受数据科学收益的机会,但这是一个非常愚蠢的方法。

企业的数据越复杂,其数据科学团队就越能建立模型,并评估项目成功的关键指标。纵观所有的企业,产品经理对于项目成功的作用是36%,管理团队的数据是29%,数据科学团队的贡献是21%。

对于那些经验丰富的企业来说,产品经理的作用依然占到34%,数据科学团队27%,几乎与管理团队(28%)相同。

对那些缺乏经验的企业而言,管理团队占到31%,数据科学团队占比较少(16%)。这不是个问题,事实是这些数据科学团队最适合计算出如何使用数据并衡量其成功。

太多时候,是外行指导外行

这种依赖管理层来推动数据科学的想法引起了人们的注意。调查显示,不少高管自称是数据驱动的,但却无视了数据其实并不支持那些靠直觉驱使的决策(62%的人承认这么做)。

那些缺乏大数据悟性的企业似乎愿意口头提供数据,但他们根本不明白有效数据科学的细微差别。他们缺乏必备的经验来确保可以获得有意义的、无偏见的数据洞察力。

关于如何理解机器学习模型,以及如何相信该模型所导致的结果,更多有成熟经验的企业显然掌握了Gartner博客网络中的一位博主Andrew White的评估方法:

AI的创新之处就在于AI可以重新定义新的基线,换句话说就是那些我们认为太过复杂的东西和非常规的东西,目前都可以利用AI来实现。和之前的技术相比,AI应该可以处理更加复杂而且具有认知能力的工作。

这个新的现实只有在AI自动处理的结果是合理的时候才有意义。如果这个新奇的工具所得出的决策和结果让人类无法理解,那人们就会放弃这个工具。因此在某种程度上,能否理解AI所做出的决策也非常重要。

然而,理解决策和理解算法如何工作是两回事。人是可以掌握输入、选择、权重以及结果的原理的,而即便算法能够在一定程度上将所有这些结合到一起,但我们依然无法证明这一进程。如果结果和输入之间的差距太大,那么人对算法的信任就很有可能会丧失——这是人的天性。

想要达到这种理解水平是无法通过花钱雇佣咨询顾问能实现的。云端也不是现成的。运用工具比如Google的AutoML可以“使得那些具有有限机器学习专长经验的开发者能训练针对其业务需求的高质量模型。”这听起来非常好,但是想要从数据科学中受益需要有数据科学的经验。这不仅仅是调整模型的问题,更需要知道如何实现,这需要大量的试错经验。

另外,从事数据科学需要有人文的心态,再次强调,需要经验。没有捷径可循。实际上,这意味着那些早期投资于数据科学的企业应该发现自己领先于那些没有竞争优势的同行——这种差异很可能会持续下去。

对于那些希望迎头赶上的企业,Gartner分析师Svetlana Sicular最为经典的忠告仍然在耳边回响:“企业应该在内部多看看。其实内部已经有人比那些神秘的数据科学家更了解自己的数据。”只要企业明白要在企业完成好的数据科学需要花费时间,并且给予其人员学习和成长的空间,他们就不再需要寻找捷径。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46838

    浏览量

    237487
  • 机器学习
    +关注

    关注

    66

    文章

    8375

    浏览量

    132397
收藏 人收藏

    评论

    相关推荐

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能
    的头像 发表于 11-16 01:07 194次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习机器
    的头像 发表于 11-15 09:19 269次阅读

    具身智能与机器学习的关系

    具身智能(Embodied Intelligence)和机器学习(Machine Learning)是人工智能领域的两个重要概念,它们之间存在着密切的关系。 1. 具身智能的定义 具身智能是指智能体
    的头像 发表于 10-27 10:33 267次阅读

    人工智能、机器学习和深度学习存在什么区别

    人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术,但其中一个很大的子集是机器学习——让算法从数据中学习
    发表于 10-24 17:22 2443次阅读
    人工智能、<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>存在什么区别

    【「时间序列与机器学习」阅读体验】+ 简单建议

    这本书以其系统性的框架和深入浅出的讲解,为读者绘制了一幅时间序列分析与机器学习融合应用的宏伟蓝图。作者不仅扎实地构建了时间序列分析的基础知识,更巧妙地展示了机器学习如何在这一领域发挥巨
    发表于 08-12 11:21

    人工智能、机器学习和深度学习是什么

    在科技日新月异的今天,人工智能(Artificial Intelligence, AI)、机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)已成为
    的头像 发表于 07-03 18:22 1097次阅读

    机器学习算法原理详解

    机器学习作为人工智能的一个重要分支,其目标是通过让计算机自动从数据中学习并改进其性能,而无需进行明确的编程。本文将深入解读几种常见的机器学习
    的头像 发表于 07-02 11:25 741次阅读

    机器学习在数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从数据中学习规律,为企业和组织提供了更高效、更准确的数据分析能力。本文将深入探讨机器
    的头像 发表于 07-02 11:22 543次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1178次阅读

    机器学习的经典算法与应用

    关于数据机器学习就是喂入算法和数据,让算法从数据中寻找一种相应的关系。Iris鸢尾花数据集是一个经典数据集,在统计学习机器学习领域都经常被
    的头像 发表于 06-27 08:27 1567次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典算法与应用

    请问PSoC™ Creator IDE可以支持IMAGIMOB机器学习吗?

    我的项目使用 POSC62 MCU 进行开发,由于 UDB 模块是需求的重要组成部分,所以我选择了PSoC™ Creator IDE 来进行项目开发。 但现在,由于需要扩展,我不得不使用机器学习模块
    发表于 05-20 08:06

    机器学习如何助力芯片设计

    1959年,计算机游戏和人工智能的先驱亚瑟·塞缪尔(Arthur Samuel)将ML定义为“使计算机能够在没有明确编程的情况下学习的研究领域”。
    的头像 发表于 03-29 10:03 488次阅读

    机器学习8大调参技巧

    今天给大家一篇关于机器学习调参技巧的文章。超参数调优是机器学习例程中的基本步骤之一。该方法也称为超参数优化,需要搜索超参数的最佳配置以实现最佳性能。
    的头像 发表于 03-23 08:26 561次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>8大调参技巧

    如何使用TensorFlow构建机器学习模型

    在这篇文章中,我将逐步讲解如何使用 TensorFlow 创建一个简单的机器学习模型。
    的头像 发表于 01-08 09:25 907次阅读
    如何使用TensorFlow构建<b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型

    弯曲时请小心:为什么不应该利用元件脚端弯曲这个捷径

    弯曲时请小心:为什么不应该利用元件脚端弯曲这个捷径
    的头像 发表于 12-15 16:56 325次阅读
    弯曲时请小心:为什么不应该利用元件脚端弯曲这个<b class='flag-5'>捷径</b>