0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分布式架构为AI工作负载提供有效的解决方案

王涛 来源:秦小姐9048 作者:秦小姐9048 2022-07-22 08:06 次阅读

人工智能AI) 在相对较短的时间内从科幻小说变成了我们生活中不可或缺的一部分。当您想到 AI 时,您可能会想到能够在国际象棋、围棋或“危险”中超越人类的自动驾驶汽车或计算机。现实情况是,你会发现人工智能应用无处不在——在定制的谷歌新闻源、潘多拉播放列表、Netflix 推荐、智能扬声器语音识别、智能助手中的自然语言处理、车辆中的计算机视觉、智能工厂——还有无数更多的例子。当您从亚马逊购物时,机器学习 (ML) 会在幕后工作,从提出购买建议到将点击发货时间缩短到仅 15 分钟。

随着人工智能应用程序对消费者越来越重要,数十亿美元现在在商业世界中处于危险之中。例如,97% 的手机用户使用人工智能语音助手。Siri 或 Cortana 误解的语音命令对我们来说可能是一个小麻烦,但在语音助手市场上的失败代表了苹果、亚马逊和谷歌之间的竞争中损失了数十亿美元的份额 。还有更严重的挑战——错误的自动驾驶算法或医疗保健行业的误诊可能导致致命后果和法律影响。

让 AI 结果具有相关性、可靠性和易于获得性是一场竞赛。只有那些在最好的机器/深度学习基础设施上训练过的人工智能模型,来自最大的数据集,才能生存下来。

ML/深度学习:不是您的平均计算工作量

机器学习——尤其是它的子集——深度学习系统——构成了人工智能基础设施的基础。抛开复杂的数学问题不谈,最简单的 ML 算法通过对答案进行重复“猜测”来实现一个目标(例如,成功识别手写符号),并通过检查预期答案来从每个不准确的猜测中学习,直到猜测以非常高的准确度匹配预期的答案。这种反馈结构称为神经网络,训练神经网络是机器/深度学习的过程。图 1 显示了一个用于手写识别的相对简单的神经网络示例。

图1 用于手写识别的神经网络示例[6]

深度神经网络使用更多层来获得复杂目标的准确答案。深度学习过程使用不断增加的训练数据集来训练深度神经网络。目标越复杂,神经网络中的层数就越多,神经网络就越难训练。例如,百度的中文语音识别模型使用约 12,000 小时的语音训练数据,需要数十 exaflops 的计算,这需要长达六周的时间才能完成。图像识别工作负载的计算要求呈指数级增长。

传统的中央处理器CPU) 专为通用控制数据流而设计,对于 AI/ML 计算密集型工作负载效率不高。由于摩尔定律失效,供应商无法跟上 CPU 的速度或大到足以处理 AI/ML 工作负载的速度。

分布式机器学习:摩尔定律的治愈方法

设计用于处理 AI/ML 工作负载的现代服务器遵循分散式架构 - 一个由多个专用加速器包围的通用 CPU,用于处理从 ML 到加密、安全、存储和网络的任务。加速器可以是图形处理单元 (GPU)、定制的现场可编程门阵列 (FPGA) 或定制的专用集成电路的组合。开放计算项目 (OCP) [10] 最近发布了 OCP 加速器模块 (OAM)的通用外形规格,以简化服务器设计并实现模块化服务器架构。

分散式架构通过使用多个优化的数据处理器提供原始 exaflops。然而,为了实现更大规模的机器学习,处理单元需要相互充分连接。在 2018 年分布式计算原理研讨会上的演讲展示了使用 TensorFlow在 ResNet-152 图像分类方面的速度提高了近 10 倍。

图 2中显示的 ResNet-152 图像分类示例 还强调了连接性在现代高度分布式机器学习系统中的重要性,其中多达 90% 的时间可能用于节点通信

图 2 分布式机器学习的好处 - 19 天到 2.4 天

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    31133

    浏览量

    269463
  • 机器学习
    +关注

    关注

    66

    文章

    8425

    浏览量

    132770
收藏 人收藏

    评论

    相关推荐

    分布式、域控及SOA架构车身功能测试方案

    北汇信息推出分布式、域控以及SOA架构的车身功能测试解决方案,支持在实验室环境下完成车身单部件、系统级功能自动化测试,可以极大地提升车身功能的可靠性和稳定性。
    的头像 发表于 12-27 09:05 1278次阅读
    <b class='flag-5'>分布式</b>、域控及SOA<b class='flag-5'>架构</b>车身功能测试<b class='flag-5'>方案</b>

    分布式光伏企业带来哪些便捷!

    光伏开发试点方案的通知》中指出:“加快推进屋顶分布式光伏发展,拟在全国组织开展整县(市、区)推进屋顶分布式光伏开发试点工作”  一,行业痛
    的头像 发表于 11-18 15:34 259次阅读
    <b class='flag-5'>分布式</b>光伏<b class='flag-5'>为</b>企业带来哪些便捷!

    分布式光纤测温解决方案

    分布式光纤测温解决方案
    的头像 发表于 11-12 01:02 176次阅读
    <b class='flag-5'>分布式</b>光纤测温<b class='flag-5'>解决方案</b>

    一文讲清什么是分布式云化数据库!

    分布式云化数据库是一种先进的数据管理系统,它将传统的数据库技术与分布式计算、云计算和大数据处理技术相融合。这种数据库架构旨在提供高可用性、高扩展性和高性能的数据存储
    的头像 发表于 10-14 10:06 233次阅读

    基于分布式存储系统医疗影像数据存储解决方案

    基于分布式存储系统医疗影像数据存储解决方案
    的头像 发表于 09-14 09:53 335次阅读
    基于<b class='flag-5'>分布式</b>存储系统医疗影像数据存储<b class='flag-5'>解决方案</b>

    医疗PACS影像数据的极速分布式块存储解决方案

    医疗PACS影像数据的极速分布式块存储解决方案
    的头像 发表于 08-23 10:13 362次阅读
    医疗PACS影像数据的极速<b class='flag-5'>分布式</b>块存储<b class='flag-5'>解决方案</b>

    一体式IO与分布式IO:工业控制系统的两种架构

    一体式IO与分布式IO架构各有优势和局限性。选择合适的IO架构需要根据实际的生产需求、系统规模、成本预算和维护能力综合考虑。随着工业自动化技术的发展,分布式IO
    的头像 发表于 07-17 16:12 1108次阅读
    一体式IO与<b class='flag-5'>分布式</b>IO:工业控制系统的两种<b class='flag-5'>架构</b>

    黑龙江电力高性能WDS分布式存储系统解决方案

    黑龙江电力高性能WDS分布式存储系统解决方案
    的头像 发表于 07-01 09:54 397次阅读
    黑龙江电力高性能WDS<b class='flag-5'>分布式</b>存储系统<b class='flag-5'>解决方案</b>

    浪潮信息发布AS13000G7-N系列分布式全闪存储

    浪潮信息近日推出了专为大型AI模型优化的AS13000G7-N系列分布式全闪存储。该系列基于浪潮信息自研的分布式文件系统,结合新一代数据加速引擎DataTurbo,用户
    的头像 发表于 05-14 10:03 585次阅读

    超越期待:StarlingX 9.0 正式面世,企业提供可信赖、经济实惠的分布式解决方案

    、Vodafone等电信运营商所验证的健壮开源云平台,提供寻求可靠、低成本的分布式架构的企业的理想选择。 StarlingX一个面向物联网、5G、O-RAN和边缘计算的开源分布式云平
    的头像 发表于 04-15 10:03 382次阅读
    超越期待:StarlingX 9.0 正式面世,<b class='flag-5'>为</b>企业<b class='flag-5'>提供</b>可信赖、经济实惠的<b class='flag-5'>分布式</b>云<b class='flag-5'>解决方案</b>

    分布式存储与计算:大数据时代的解决方案

    分布式存储和计算技术应运而生,并迅速成为处理大数据的首选方案。本文将深入探讨分布式存储和计算的概念、优势及其在各个领域的应用情况。 1.分布式存储和计算的概念与优势
    的头像 发表于 03-07 14:42 790次阅读

    分布式智慧终端:挑战与解决方案

    分布式智慧终端在应用中面临多种挑战,以下是其中一些关键的挑战以及可能的解决方案: 数据一致性挑战 :在分布式系统中,数据的一致性是一个关键问题。由于数据分布在多个节点上,如何保证数据的
    的头像 发表于 01-24 14:50 459次阅读

    分布式光伏电力监控解决方案

    分布式光伏电力监控解决方案
    的头像 发表于 01-14 08:07 604次阅读
    <b class='flag-5'>分布式</b>光伏电力监控<b class='flag-5'>解决方案</b>

    什么是分布式架构?

    1.独立性:分布式架构中的各个节点是独立运行的,它们没有依赖关系,可以单独进行升级、维护和扩展。 2.通信性:分布式架构中的各个节点通过网络连接进行通信和协作,以实现数据的传输和共享
    的头像 发表于 01-12 15:04 1277次阅读
    什么是<b class='flag-5'>分布式</b><b class='flag-5'>架构</b>?

    分布式节点服务器是什么?

    分布式节点服务器是一种将多个服务器分布式连接、协同工作,以实现负载均衡、提高系统性能和可靠性、提供高可用性的服务器
    的头像 发表于 01-12 15:04 754次阅读
    <b class='flag-5'>分布式</b>节点服务器是什么?