MLPerf训练评估已部署机器学习模型的执行时间-电子发烧友网

机器学习（ML）需要行业标准的性能基准，以帮助创建和竞争评估众多与 ML 相关的软件和硬件解决方案。

然而，与其他领域不同，ML 训练面临三个不同的基准测试挑战：

提高训练吞吐量的优化可以增加求解时间。

训练是随机的，解决问题的时间差异很大。

软件和硬件系统如此多样化，以至于很难使用相同的二进制文件、代码甚至超参数进行公平的基准测试。

MLcommons 的机器学习基准测试解决方案 MLPerf 旨在解决这些问题。MLPerf 在推动性能和可扩展性改进方面的功效在来自不同制造商的两组数据中进行了统计评估。

MLPerf 旨在为机器学习提供一个具有代表性的基准套件，以正确测量系统性能，以实现五个高级目标：

允许对竞争系统进行公平比较，同时促进机器学习创新。

通过以公平和相关的方式衡量 ML 开发速度。

确保一致性结果的可重复性。

为商业和学术团体提供服务。

保持较低的基准测试成本，以便每个人都可以参与。

MLPerf 创建了一个基准套件，其中包括各种应用程序、DNN 模型和优化器。它还准确地指定了模型和训练技术，以创建每个基准的参考实现。MLPerf 在比较结果时建立了时间限制以减少随机性的影响。此外，它允许 ML 和系统社区通过使提交代码开源来检查和复制结果。

每个基准都会计算在给定数据集上训练模型以达到给定质量目标所需的时间。最终结果是通过以特定于基准的次数测量基准，删除最低和最高值，并对剩余结果进行平均以解释 ML 训练持续时间的巨大差异来生成的。即使是平均结果数量也不足以消除所有波动。成像基准的结果通常为 +/- 2.5%，而其他基准通常为 +/- 5%。

MLPerf 希望通过让提交者重新实现参考实现来刺激软件和硬件方面的创新。MLPerf 有两个部门，提供不同程度的重新实现自由度。封闭部门要求使用与参考实现相同的模型和优化器，以便比较硬件平台或软件框架，“苹果对苹果”。开放部门旨在通过允许任何机器学习技术达到预期的质量来促进更快的模型和优化器。

ML 系统的行业基准

总而言之，MLPerf Training 是涵盖商业和学术应用的机器学习基准的集合。尽管它是唯一一个广泛使用且覆盖范围如此广泛的 ML 训练基准套件，但它几乎没有做出任何贡献。首先，通过精确定义模型架构和每个基准特征的训练程序，可以对等效工作负载进行系统比较。此外，为了解决对 ML 训练进行基准测试的挑战，使用了参考实现和规则定义。训练过程的随机性、为了确定性能优化的质量影响而需要训练完成以及需要在各种系统规模下改变工作负载是一些挑战。

尽管 MLPerf 侧重于相对系统性能，但正如在线结果所证明的那样，它还提供了 ML 和基准测试的一般课程。真实数据集的大小对于确保真实的内存系统行为至关重要。例如，最初的 NCF 数据集太小而无法完全放入内存中。此外，当对小于工业规模的数据集进行基准测试时，训练时间不应包括启动时间，这在实际使用中成比例地减少。

因此，MLPerf 正在迅速将自己确立为 ML 系统的行业基准，同时也是一个理想的论坛，用于发布分析师、投资者和买家可以依赖的基准测试结果的新产品。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

测量系统

测量系统

+关注

关注
2

文章
532

浏览量
41348
机器学习

机器学习

+关注

关注
66

文章
8370

浏览量
132367

pycharm如何训练机器学习模型

PyCharm是一个流行的Python集成开发环境（IDE），它提供了丰富的功能，包括代码编辑、调试、测试等。在本文中，我们将介绍如何在PyCharm中训练机器学习模型。一、安装Py

发表于 07-11 10:14 •653次阅读

预训练和迁移学习的区别和联系

预训练和迁移学习是深度学习和机器学习领域中的两个重要概念，它们在提高模型性能、减少

发表于 07-11 10:12 •790次阅读

如何理解机器学习中的训练集、验证集和测试集

理解机器学习中的训练集、验证集和测试集，是掌握机器学习核心概念和流程的重要一步。这三者不仅构成了模型

发表于 07-10 15:45 •3102次阅读

人脸识别模型训练流程

人脸识别模型训练流程是计算机视觉领域中的一项重要技术。本文将详细介绍人脸识别模型的训练流程，包括数据准备、模型选择、

发表于 07-04 09:19 •800次阅读

解读PyTorch模型训练过程

PyTorch作为一个开源的机器学习库，以其动态计算图、易于使用的API和强大的灵活性，在深度学习领域得到了广泛的应用。本文将深入解读PyTorch模型

发表于 07-03 16:07 •890次阅读

深度学习模型训练过程详解

详细介绍深度学习模型训练的全过程，包括数据预处理、模型构建、损失函数定义、优化算法选择、训练过程以及模型

发表于 07-01 16:13 •1054次阅读

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

，如何将机器学习、深度学习或者大模型技术应用在大规模的数据生产中，是一个非常关键的问题。国内外已出版了许多关于

发表于 06-25 15:00

深度探讨：无人机干扰器干扰执行时间的关键影响因素

随着无人机技术的广泛应用，无人机干扰器作为防御和管控无人机的重要工具，其在军事、民用及公共安全等领域发挥着重要作用。然而，无人机干扰器的干扰执行时间直接决定了其有效性和实用性。本文将深入探讨无人机干扰器干扰执行时间的影响因素，并对这些因素进行详细解析。

发表于 05-29 09:27 •486次阅读

【大语言模型：原理与工程实践】核心技术综述

其预训练和微调，直到模型的部署和性能评估。以下是对这些技术的综述：模型架构: LLMs通常采用深层的神经网络架构，最常见的是Transf

发表于 05-05 10:56

请问stm32cubeIDE仿真怎么看程序执行时间？

就想keil仿真那样，可以时刻监视程序执行时间，cubeide怎么在仿真debug时，监视程序时间呢？

发表于 04-02 07:47

如何计算AURIX微控制器指令执行时间？

对于 AURIX TC38x，在数据表中，最大 CPU 频率为 300MHz，如下所示- 因此，在此频率下，每条指令的执行时间将为：1/300 MHz = 3.33 ns。这种理解正确吗？否则，如何计算每条指令的执行时间或 MIPS。这里的动机是计算特定应用的

发表于 01-23 08:08

如何使用STM模块测量函数的执行时间？

我想问你如何使用 STM 模块测量函数的执行时间。是否有可能通过BSP.H库的now () 函数为两个类型为ifx_tickTimer的变量（分别为起始变量和停止变量分配分笔数）来通过BSP默认

发表于 01-22 06:38

基于KEIL软件的C语言编程，如何计算一段程序的执行时间呢？

如题，一段程序执行时间怎样确定，假如是把每条语句的执行时间累加，那么每条语句的时间如何确定？？？有别的方法可以确定执行时间吗

发表于 01-18 06:10

如何基于深度学习模型训练实现工件切割点位置预测

Hello大家好，今天给大家分享一下如何基于深度学习模型训练实现工件切割点位置预测，主要是通过对YOLOv8姿态评估模型在自定义的数据集上

发表于 12-22 11:07 •737次阅读

如何基于深度学习模型训练实现圆检测与圆心位置预测

Hello大家好，今天给大家分享一下如何基于深度学习模型训练实现圆检测与圆心位置预测，主要是通过对YOLOv8姿态评估模型在自定义的数据集上

发表于 12-21 10:50 •1695次阅读

搜索历史

MLPerf训练评估已部署机器学习模型的执行时间

评论

pycharm如何训练机器学习模型

预训练和迁移学习的区别和联系

如何理解机器学习中的训练集、验证集和测试集

人脸识别模型训练流程

解读PyTorch模型训练过程

深度学习模型训练过程详解

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

深度探讨：无人机干扰器干扰执行时间的关键影响因素

【大语言模型：原理与工程实践】核心技术综述

请问stm32cubeIDE仿真怎么看程序执行时间？

如何计算AURIX微控制器指令执行时间？

如何使用STM模块测量函数的执行时间？

基于KEIL软件的C语言编程，如何计算一段程序的执行时间呢？

如何基于深度学习模型训练实现工件切割点位置预测

如何基于深度学习模型训练实现圆检测与圆心位置预测