谷歌研究人员发现了机器学习模型常见失败的一个主要原因-电子发烧友网

机器学习模型在实验室中调整和调整到近乎完美的性能，但在现实环境中往往会失败，这已经不是什么秘密了。这通常被归结为人工智能接受训练和测试的数据与它在现实中遇到的数据不匹配，这个问题被称为数据转移。例如，经过训练，能够在高质量的医学图像中发现疾病迹象的人工智能，将难以识别繁忙的诊所中廉价相机捕捉到的模糊或裁剪的图像。

现在，谷歌的7个不同团队的40名研究人员发现了机器学习模型常见失败的另一个主要原因。这被称为“不规范”，它可能是一个比数据转移更大的问题。领导这项研究的Alex D‘amour说：“我们对机器学习模型的要求比我们目前的方法所能保证的要多。”

D’amour最初的调查如同滚雪球般滚来滚去，数十名谷歌研究人员最终着眼于一系列不同的人工智能应用，从图像识别到自然语言处理（NLP）再到疾病预测。他们发现，不规范的要求是所有这些项目表现不佳的原因。问题在于机器学习模型的训练和测试方式，没有简单的解决办法。

粗略地说，建立一个机器学习模型需要在大量的例子上训练它，然后在一堆它还没有见过的类似的例子上测试它。当模型通过测试时，就完成了。

谷歌的研究人员指出，这个标准太低了。训练过程可以产生许多不同的全部通过测试的模型，但是这些模型会有一些小差异，取决于诸如在培训开始之前随机值的神经网络中的节点、训练数据、被选中或者代表的方式、培训运行的数量等等。如果这些微小的、随机的差异不影响模型在测试中的表现，它们通常会被忽视。但事实证明，在现实世界中，它们会导致巨大的表现差异。

换句话说，如今用来构建大多数机器学习模型的过程无法区分哪些模型在现实世界中可行，哪些模型不可行。

为了解决这一问题，一种选择是在培训和测试过程中设计一个额外的阶段，在这个阶段中可以同时生产多个模型，而不是只生产一个。然后，这些相互竞争的模型可以在具体的现实任务中再次进行测试，以选择最适合这项工作的模型。

那需要做很多工作。苏黎世联邦理工学院的机器学习研究员Yannic Kilcher说，但是对于像谷歌这样建造和部署大型模型的公司来说，这样做是值得的。谷歌可以提供50种不同版本的NLP模型，应用程序开发人员可以选择最适合他们的一个，他说。

D ‘Amour和他的同事们还没有解决这个问题，但正在探索改进培训过程的方法。他表示：“我们需要更好地明确我们对模型的要求。”“因为最终的结果往往是，我们只是在模型在实际应用中失败之后才发现这些要求。”

如果人工智能想要在实验室之外产生和在实验室内部一样大的影响，那么进行修复是至关重要的。在谷歌从事医疗人工智能领域工作的合著者凯瑟琳海勒（Katherine Heller）表示，当人工智能在现实世界中表现不佳时，人们就不太愿意使用它了：“在杀手级应用方面，我们已经失去了很多信任，这是我们希望重新获得的重要信任。”

责任编辑：xj

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6164

浏览量
105314
AI

AI

+关注

关注
87

文章
30763

浏览量
268907
机器学习

机器学习

+关注

关注
66

文章
8408

浏览量
132573
nlp

nlp

+关注

关注
1

文章
488

浏览量
22033

【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

解和响应人类情感方面的一个重要步骤；谷歌的 Atlas 机器人和特斯拉的 Tesla Bot 展示了在物理能力和智能控制方面的先进成果；丰

发表于 11-11 10:20

华纳云：企业迁移到云端的主要原因是什么？

企业迁移到云端的主要原因是什么?原因不止一个。削减成本通常被认为是主要原因——但尽管通过云迁移降低成本无疑是

发表于 09-14 17:38 •286次阅读

【「时间序列与机器学习」阅读体验】+ 简单建议

简单评价这本书。是这样，在阅读与实践过程中，我也发现了一些可以进一步提升用户体验的细节之处。例如，书中大量的代码示例对于学习者来说无疑是宝贵的资源，但在快速复制粘贴的过程中，偶尔会

发表于 08-12 11:21

【《大语言模型应用指南》阅读体验】+ 俯瞰全书

上周收到《大语言模型应用指南》一书，非常高兴，但工作项目繁忙，今天才品鉴体验，感谢作者编写了一部内容丰富、理论应用相结合、印刷精美的著作，也感谢电子发烧友论坛提供了

发表于 07-21 13:35

人脸识别模型训练失败原因有哪些

人脸识别模型训练失败的原因有很多，以下是一些常见的原因及其解决方案：数据集质量问题数据集是训

发表于 07-04 09:17 •606次阅读

谷歌发布新型大语言模型Gemma 2

在人工智能领域，大语言模型一直是研究的热点。近日，全球科技巨头谷歌宣布，面向全球研究人员和开发人员

发表于 06-29 09:48 •435次阅读

焊接质量缺陷产生的主要原因

创想焊缝跟踪小编将与大家一起探讨焊接质量缺陷产生的主要原因。材料选择不当焊接质量缺陷的主要原因之一是材料选择不当。焊接材料包括焊条、电极、焊丝、焊剂等，如果选择的焊接材料与基材不匹配，或者焊接材料的质量

发表于 05-15 09:41 •649次阅读

谐波引起电缆损坏的主要原因

谐波是指在电力系统中出现的频率为整数倍于基波频率的波动现象。在电缆中传输的电能中，谐波存在的情况是很常见的。然而，谐波也是导致电缆损坏的主要原因之一。

发表于 03-14 14:20 •693次阅读

谷歌模型框架是什么软件？谷歌模型框架怎么用？

谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架，其中最著名的是TensorFlow。TensorFlow是

发表于 03-01 16:25 •870次阅读

谷歌模型框架是什么？有哪些功能和应用？

谷歌模型框架（Google Model Framework）并不是一个特定的框架，而是指谷歌开发的一

发表于 02-29 18:11 •1470次阅读

谷歌发布轻量级开源人工智能模型Gemma

谷歌近日宣布推出开源人工智能（AI）模型系列Gemma，旨在为开发人员和研究人员提供一个负责任的

发表于 02-23 11:38 •853次阅读

谷歌宣布Gemma大模型全球开放使用

使用标志着谷歌在AI领域的新里程碑，为全球的开发者、研究人员和企业提供了强大的工具，以推动人工智能技术的进步和应用。

发表于 02-23 10:41 •770次阅读

辊压机轴承位磨损主要原因

电子发烧友网站提供《辊压机轴承位磨损主要原因.docx》资料免费下载

发表于 01-10 14:10 •0次下载

现代独立显卡电力消耗的主要原因

现代独立显卡电力消耗的主要原因 近年来，随着科技的不断发展和人们对高画质游戏和图形处理需求的增加，独立显卡已经成为电脑的必备硬件之一。然而，独立显卡的电力消耗问题也逐渐浮出水面。本文将详细探讨现代

发表于 01-09 13:52 •552次阅读

如何使用TensorFlow构建机器学习模型

在这篇文章中，我将逐步讲解如何使用 TensorFlow 创建一个简单的机器学习模型。

发表于 01-08 09:25 •968次阅读

搜索历史

谷歌研究人员发现了机器学习模型常见失败的一个主要原因

评论

【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

华纳云：企业迁移到云端的主要原因是什么？

【「时间序列与机器学习」阅读体验】+ 简单建议

【《大语言模型应用指南》阅读体验】+ 俯瞰全书

人脸识别模型训练失败原因有哪些

谷歌发布新型大语言模型Gemma 2

焊接质量缺陷产生的主要原因

谐波引起电缆损坏的主要原因

谷歌模型框架是什么软件？谷歌模型框架怎么用？

谷歌模型框架是什么？有哪些功能和应用？

谷歌发布轻量级开源人工智能模型Gemma

谷歌宣布Gemma大模型全球开放使用

辊压机轴承位磨损主要原因

现代独立显卡电力消耗的主要原因

如何使用TensorFlow构建机器学习模型