0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌研究人员发现了机器学习模型常见失败的一个主要原因

ss 来源:OFweek物联网 作者:OFweek物联网 2020-11-30 17:44 次阅读

机器学习模型在实验室中调整和调整到近乎完美的性能,但在现实环境中往往会失败,这已经不是什么秘密了。这通常被归结为人工智能接受训练和测试的数据与它在现实中遇到的数据不匹配,这个问题被称为数据转移。例如,经过训练,能够在高质量的医学图像中发现疾病迹象的人工智能,将难以识别繁忙的诊所中廉价相机捕捉到的模糊或裁剪的图像。

现在,谷歌的7个不同团队的40名研究人员发现了机器学习模型常见失败的另一个主要原因。这被称为“不规范”,它可能是一个比数据转移更大的问题。领导这项研究的Alex D‘amour说:“我们对机器学习模型的要求比我们目前的方法所能保证的要多。”

D’amour最初的调查如同滚雪球般滚来滚去,数十名谷歌研究人员最终着眼于一系列不同的人工智能应用,从图像识别到自然语言处理(NLP)再到疾病预测。他们发现,不规范的要求是所有这些项目表现不佳的原因。问题在于机器学习模型的训练和测试方式,没有简单的解决办法。

粗略地说,建立一个机器学习模型需要在大量的例子上训练它,然后在一堆它还没有见过的类似的例子上测试它。当模型通过测试时,就完成了。

谷歌的研究人员指出,这个标准太低了。训练过程可以产生许多不同的全部通过测试的模型,但是这些模型会有一些小差异,取决于诸如在培训开始之前随机值的神经网络中的节点、训练数据、被选中或者代表的方式、培训运行的数量等等。如果这些微小的、随机的差异不影响模型在测试中的表现,它们通常会被忽视。但事实证明,在现实世界中,它们会导致巨大的表现差异。

换句话说,如今用来构建大多数机器学习模型的过程无法区分哪些模型在现实世界中可行,哪些模型不可行。

为了解决这一问题,一种选择是在培训和测试过程中设计一个额外的阶段,在这个阶段中可以同时生产多个模型,而不是只生产一个。然后,这些相互竞争的模型可以在具体的现实任务中再次进行测试,以选择最适合这项工作的模型。

那需要做很多工作。苏黎世联邦理工学院的机器学习研究员Yannic Kilcher说,但是对于像谷歌这样建造和部署大型模型的公司来说,这样做是值得的。谷歌可以提供50种不同版本的NLP模型,应用程序开发人员可以选择最适合他们的一个,他说。

D ‘Amour和他的同事们还没有解决这个问题,但正在探索改进培训过程的方法。他表示:“我们需要更好地明确我们对模型的要求。”“因为最终的结果往往是,我们只是在模型在实际应用中失败之后才发现这些要求。”

如果人工智能想要在实验室之外产生和在实验室内部一样大的影响,那么进行修复是至关重要的。在谷歌从事医疗人工智能领域工作的合著者凯瑟琳海勒(Katherine Heller)表示,当人工智能在现实世界中表现不佳时,人们就不太愿意使用它了:“在杀手级应用方面,我们已经失去了很多信任,这是我们希望重新获得的重要信任。”

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6141

    浏览量

    105073
  • AI
    AI
    +关注

    关注

    87

    文章

    30095

    浏览量

    268363
  • 机器学习
    +关注

    关注

    66

    文章

    8375

    浏览量

    132397
  • nlp
    nlp
    +关注

    关注

    1

    文章

    487

    浏览量

    22007
收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    解和响应人类情感方面的重要步骤;谷歌的 Atlas 机器人和特斯拉的 Tesla Bot 展 示在物理能力和智能控制方面的先进成果;丰
    发表于 11-11 10:20

    华纳云:企业迁移到云端的主要原因是什么?

    企业迁移到云端的主要原因是什么?原因不止。削减成本通常被认为是主要原因——但尽管通过云迁移降低成本无疑是
    的头像 发表于 09-14 17:38 257次阅读

    【「时间序列与机器学习」阅读体验】+ 简单建议

    简单评价这本书。 是这样,在阅读与实践过程中,我也发现了些可以进步提升用户体验的细节之处。 例如,书中大量的代码示例对于学习者来说无疑是宝贵的资源,但在快速复制粘贴的过程中,偶尔会
    发表于 08-12 11:21

    人脸识别模型训练失败原因有哪些

    人脸识别模型训练失败原因有很多,以下是常见原因及其解决方案: 数据集质量问题 数据集是训
    的头像 发表于 07-04 09:17 534次阅读

    谷歌发布新型大语言模型Gemma 2

    在人工智能领域,大语言模型直是研究的热点。近日,全球科技巨头谷歌宣布,面向全球研究人员和开发人员
    的头像 发表于 06-29 09:48 403次阅读

    焊接质量缺陷产生的主要原因

    创想焊缝跟踪小编将与大家起探讨焊接质量缺陷产生的主要原因。 材料选择不当 焊接质量缺陷的主要原因之一是材料选择不当。焊接材料包括焊条、电极、焊丝、焊剂等,如果选择的焊接材料与基材不匹配,或者焊接材料的质量
    的头像 发表于 05-15 09:41 577次阅读
    焊接质量缺陷产生的<b class='flag-5'>主要原因</b>

    谐波引起电缆损坏的主要原因

    谐波是指在电力系统中出现的频率为整数倍于基波频率的波动现象。在电缆中传输的电能中,谐波存在的情况是很常见的。然而,谐波也是导致电缆损坏的主要原因之一
    的头像 发表于 03-14 14:20 644次阅读
    谐波引起电缆损坏的<b class='flag-5'>主要原因</b>

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是
    的头像 发表于 03-01 16:25 792次阅读

    谷歌发布轻量级开源人工智能模型Gemma

    谷歌近日宣布推出开源人工智能(AI)模型系列Gemma,旨在为开发人员研究人员提供负责任的
    的头像 发表于 02-23 11:38 797次阅读

    谷歌宣布Gemma大模型全球开放使用

    使用标志着谷歌在AI领域的新里程碑,为全球的开发者、研究人员和企业提供强大的工具,以推动人工智能技术的进步和应用。
    的头像 发表于 02-23 10:41 730次阅读

    现代独立显卡电力消耗的主要原因

    现代独立显卡电力消耗的主要原因 近年来,随着科技的不断发展和人们对高画质游戏和图形处理需求的增加,独立显卡已经成为电脑的必备硬件之。然而,独立显卡的电力消耗问题也逐渐浮出水面。本文将详细探讨现代
    的头像 发表于 01-09 13:52 507次阅读

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    训练是MetaAI研究人员认为的种降低模型使用成本的方式。为了更好的效果,即便是LLaMA最小的70亿参数的版本,其训练使用的tokens数量也有1万亿(1 trillion to
    发表于 12-22 10:18

    LabVIEW进行癌症预测模型研究

    效果。 LabVIEW在此研究中的应用展示其在处理复杂医学数据和开发高效预测模型方面的独特优势,特别是在癌症早期诊断和治疗策略的研究中。通过使用LabVIEW,
    发表于 12-13 19:04

    7种光缆故障的主要原因

    7种光缆故障的主要原因  光缆故障是指光缆在传输信息过程中出现的问题,影响着光信号的传输质量和速度。这些故障可能由多种原因引起,下面将详细介绍7种光缆故障的主要原因。 1. 光缆折断 光缆折断是最
    的头像 发表于 12-07 09:40 2247次阅读

    为什么共模电流是EMI的主要原因

    为什么共模电流是EMI的主要原因
    的头像 发表于 12-05 15:56 435次阅读
    为什么共模电流是EMI的<b class='flag-5'>主要原因</b>