0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习项目失败的十大原因

姚小熊27 来源:企业网D1net 作者:企业网D1net 2020-11-05 13:55 次阅读

如今人们总是能听到有关机器学习的新闻,而机器学习技术确实有更多发展潜力。调研机构Gartner公司预测,对于很多组织来说,80%的人工智能项目仍是一种难以获得成功的炼金术。根据VentureBeat公司发布的“Transform2019”研究报告,87%的人工智能项目将永远无法投入生产。

为什么会这样呢?为什么这么多项目失败?

1.没有足够的专业知识

其中一个原因是,机器学习技术对人们来说仍然是新技术。此外,大多数组织仍不熟悉软件工具和所需的硬件

如今,从事数据分析或软件开发工作并完成了一些数据科学项目的一些人却将自己标榜为数据科学家。

事实上,组织需要经验丰富的真正数据科学家来处理大多数机器学习和人工智能项目,尤其是在定义成功标准、最终部署和模型的持续监控方面。

2.数据科学与传统软件开发之间的脱节

数据科学与传统软件开发之间的脱节是另一个主要因素。传统的软件开发往往更具可预测性和可衡量性。

数据科学研究通过多次迭代和试验而向前发展。有时,由于选择的度量标准不会驱动用户行为,因此整个项目将不得不从部署阶段返回到计划阶段。

传统的基于敏捷的项目交付可能不适用于数据科学项目。对于在常规软件开发项目的每个任务周期结束时一直在努力交付清晰结果的领导者来说,这将造成大规模的混乱。

3.数据量和质量

众所周知,数据集越大,采用人工智能系统进行的预测就越好。除了数据量增加的直接影响之外,随着数据量的增加,还会出现许多新的挑战。

在许多情况下,组织将不得不合并来自多个源的数据。一旦开始这样做,就会意识到它们同步的次数很少,这将导致很多混乱。有时,组织最终将合并不应该合并的数据,这将导致数据点具有相同的名称但含义不同。

错误的数据会带来无法采取行动或无法提供真知灼见的结果,也会导致误导性结果。

4. 标记数据

标记数据的不可用是另一个阻碍机器学习项目的挑战。《麻省理工学院斯隆管理评论》杂志指出,76%的人通过尝试自己标记和注释训练数据来应对这一挑战,而63%的人甚至尝试构建自己的标记和注释自动化技术。

这意味着数据科学家在标记过程中无法充分利用其专业知识。这是有效执行人工智能项目的主要挑战。

这就是许多公司将标记任务外包给其他公司的原因。但是,如果标记任务需要足够的领域知识,则将标记任务外包是一个挑战。如果组织需要保持数据集之间的质量和一致性,则必须投资于标记人员的标准化培训。

如果要标记的数据很复杂,则另一个选择是开发自己的数据标记工具。但是,与机器学习任务本身相比,这通常需要更多的成本。

5.组织孤立无援

数据是机器学习项目中最重要的实体。在大多数组织中,这些数据将以不同的安全约束和不同格式(例如结构化、非结构化、视频文件、音频文件、文本和图像)驻留在不同的位置。

在不同的地方以不同的格式保存这些数据本身就是一个挑战。然而,当组织孤立无援而却没有相互协作时,其挑战就会加倍。

6.缺乏合作

另一个主要挑战是不同团队之间缺乏协作,如数据科学家、数据工程师、数据管理员、商业智能(BI)专家、DevOps和工程。这对于物联网到数据科学的工程方案中的团队尤其重要,因为他们在工作方式和完成项目所使用的技术上有很多不同。

工程团队将实施机器学习模型并将其投入生产。因此,他们之间需要有适当的理解和强有力的协作。

7.技术上不可行的项目

由于机器学习项目的成本往往非常昂贵,因此大多数企业倾向于以雄心勃勃的“登月计划”为目标,这将完全改变组织或产品并带来超额回报或投资。

这样的项目将永远无法完成,并将推动数据科学团队达到极限。最终,企业领导者将对项目失去信心并停止投资。

8.技术团队和业务团队之间的协调问题

很多时候,机器学习项目在业务团队和数据科学团队之间在项目的期望、目标和成功标准上没有明确的一致性。

这些类型的项目将永远停留在研究阶段,因为他们永远不知道自己是否正在取得进展,因为至今还不清楚其目标是什么。

在这里,数据科学团队将主要专注于准确性,而业务团队将对诸如财务收益或业务洞察力之类的指标更感兴趣。最后,业务团队最终不接受数据科学团队的结果。

9.缺乏数据策略

根据《麻省理工学院斯隆管理评论》杂志的调查,员工人数超过10万名的大型组织将有50%可能采用数据策略。而组织在开始机器学习项目之前制定可靠的数据策略至关重要。

组织需要对以下内容有清晰的了解,这是数据策略的一部分:

组织拥有的全部数据是多少? 项目实际需要多少数据? 所需的人员将如何访问这些数据,以及这些人员访问这些数据的容易程度? 如何将来自不同来源的所有这些数据汇总在一起? 如何清理和转换这些数据?

大多数组织一开始没有计划,或者根本没有想到自己没有数据。

10.缺乏领导支持

很多人认为,只需要投入一些资金和技术来解决问题,其结果就会自动出现。

但是他们没有看到组织领导者提供正确的支持来确保成功所需的条件,而组织领导者有时对数据科学家开发的模型没有信心。

这可能是由于组织的领导者对人工智能缺乏了解,以及数据科学家无法向他们传达模型具有业务利益的原因。

最终,组织的领导者需要了解机器学习的工作原理以及人工智能对组织的真正意义。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47255

    浏览量

    238409
  • 机器学习
    +关注

    关注

    66

    文章

    8416

    浏览量

    132616
收藏 人收藏

    评论

    相关推荐

    商汤科技入选2024年CCF十大技术公益优秀案例

    近日,在中国计算机领域最具权威性、规模最大的学术盛会——中国计算机大会(CNCC)上,公布了2024“CCF十大技术公益优秀案例”,商汤医疗大模型“大医”从近百个项目中脱颖而出,凭借在公益领域的突出贡献成功入选。
    的头像 发表于 10-30 14:51 226次阅读

    烧结银AS9378火爆的六大原因

    低温烧结银AS9378近年来在电子材料领域迅速崛起,其火爆程度令人瞩目。这款采用纳米技术和低温烧结工艺的高性能材料,凭借其独特的优势在众多应用中脱颖而出。以下,我们将深入探讨低温烧结银AS9378火爆的六大原因
    的头像 发表于 09-20 17:27 402次阅读

    晶闸管逆变失败原因和解决方案

    晶闸管逆变失败是电力电子领域中的一个常见问题,它可能由多种因素引起,并可能对系统造成严重的损害。以下是对晶闸管逆变失败原因及解决方法的详细探讨,旨在提供全面且深入的理解。
    的头像 发表于 08-27 16:26 1467次阅读

    中国信通院发布“2024云计算十大关键词”

    7月23日,由中国通信标准化协会主办,中国信息通信研究院(简称“中国信通院”)承办的“2024可信云大会”在京召开。大会上,中国信通院正式发布“2024云计算十大关键词”,中国信通院云计算与大数
    的头像 发表于 08-02 08:28 627次阅读
    中国信通院发布“2024云计算<b class='flag-5'>十大</b>关键词”

    人脸识别模型训练失败原因有哪些

    人脸识别模型训练失败原因有很多,以下是一些常见的原因及其解决方案: 数据集质量问题 数据集是训练人脸识别模型的基础。如果数据集存在质量问题,将直接影响模型的训练效果。以下是一些常见的数据集质量问题
    的头像 发表于 07-04 09:17 615次阅读

    电机振动的原因分析及预防措施

    振动的原因并采取相应的预防措施,对于保障电机的稳定运行具有重要意义。本文将对电机振动的十大原因进行详细分析,并提出相应的预防措施。
    的头像 发表于 06-14 14:09 1214次阅读

    请问PSoC™ Creator IDE可以支持IMAGIMOB机器学习吗?

    我的项目使用 POSC62 MCU 进行开发,由于 UDB 模块是需求的重要组成部分,所以我选择了PSoC™ Creator IDE 来进行项目开发。 但现在,由于需要扩展,我不得不使用机器
    发表于 05-20 08:06

    ESP32-S3模组烧录又失败?分享怎么排查原因

    ESP32-S3模组在物联网中非常好用,可以做带屏小音箱、温控器、智能86盒、泳池清洁机器人等等,在烧录的时候经常会遇到一些问题,这里分享一些烧录失败原因或者烧录遇到的问题,教大家怎么排查
    的头像 发表于 05-11 08:04 3173次阅读
    ESP32-S3模组烧录又<b class='flag-5'>失败</b>?分享怎么排查<b class='flag-5'>原因</b>

    STM32的ADC项目应用,用什么算法滤波和稳定数据抖动?

    STM32的ADC项目应用,大家都用什么算法滤波和稳定数据抖动。 ADC数据的抖动有时候应用在项目上让人很是头疼,什么度娘十大滤波算法也是要斟酌选用。 单片机项目设计中,外设ADC的
    发表于 04-17 08:20

    光纤熔接机熔接失败原因

    光纤熔接机是一种用于将光纤进行熔接的设备,它在光纤通信领域中具有非常重要的作用。然而,在使用光纤熔接机的过程中,可能会出现熔接失败的情况。本文将详细介绍光纤熔接机熔接失败原因,包括设备故障、操作
    的头像 发表于 04-07 17:22 2612次阅读

    为什么利用STM32cubeMX生成项目总是失败,有哪些原因

    利用STM32cubeMX生成项目总是失败
    发表于 04-03 08:29

    GD32 MCU ISP失败原因

    玩过GD32的小伙伴们都知道,GD32 MCU支持ISP,即在系统编程,前面的常见问题也给大家讲过什么是ISP,什么是IAP?那有没有小伙伴遇到过ISP失败的情况,失败原因是什么呢?
    的头像 发表于 02-28 09:23 1478次阅读
    GD32 MCU ISP<b class='flag-5'>失败</b>的<b class='flag-5'>原因</b>

    睿创微纳8微米荣获“2023年度山东十大科技创新成果”

    1月11日,两院院士评选“2023年中国/世界十大科技进展新闻”发布会在烟台召开,会上公布“2023年度山东省十大科技创新成果”榜单。
    的头像 发表于 01-16 09:48 544次阅读
    睿创微纳8微米荣获“2023年度山东<b class='flag-5'>十大</b>科技创新成果”

    2023年度十大科技名词

    12月26日,“2023年度十大科技名词”在京发布。“大语言模型、生成式人工智能、量子计算、脑机接口、数据要素、智慧城市、碳足迹、柔性制造、再生稻、可控核聚变”入选。个最具影响力和代表性的科技名词
    的头像 发表于 01-03 08:27 617次阅读
    2023年度<b class='flag-5'>十大</b>科技名词

    新一代MES十大核心要素

    电子发烧友网站提供《新一代MES十大核心要素.docx》资料免费下载
    发表于 12-29 11:14 0次下载