0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘人工智能数据中心的未来是本地云

星星科技指导员 来源:NVIDIA 作者:wnger 2022-04-01 17:20 次阅读

推理因其灵活性而成为边缘计算的杀手级应用。今天,边缘推理(也称为边缘 AI)解决了各个行业的问题:防止盗窃、发现疾病和减少农田中除草剂的使用。但对许多人来说,管理分布式边缘服务器的复杂性可能会侵蚀业务价值。

边缘人工智能数据中心在一个位置上没有 10000 台服务器。它在 10000 个位置有一个或多个服务器,通常位于没有物理安全或训练有素的 It 人员的位置。因此,边缘人工智能服务器必须安全、有弹性,并且易于大规模管理。

Diagram shows the data center EGX servers accessing NGC frameworks and then uploading trained models; deploying the models to the edge and analyzing streaming data; sending low-confidence data back to the EGX servers; and using that data to re-train the models.

图 1 。使用 edge AI 的数据中心到云工作流

这就是为什么组织正在转向云本地技术来管理其边缘 AI 数据中心。

什么是云本机?

定义 Cloud Native 就像一个关于蒙着眼睛描述大象的笑话。你是在摸象牙、鼻子还是尾巴?

对于 IT 管理员来说,云本机意味着以代码形式管理基础设施。

软件开发人员使用云本地工具和技术来编写可移植应用程序。

IT 主管们拥抱云文化以降低成本并提高效率。

结合这些观点, Cloud Native 是一种现代的软件开发方法,它使用抽象和自动化来支持可扩展性、可移植性和快速交付。

容器化微服务是云本地应用程序的有效标准。Kubernetes是容器编排的市场领先平台。它使用 de Clara 动态 API 支持大规模自动化。

Cloud native 诞生于公共云,但它正在企业中迅速传播。 Gartner 预测,容器编排市场将增长到到 2024 年为 9 。 44 亿美元。

云计算基础( CNCF )为生态系统提供供应商中立的治理。 CNCF 策划并支持开源、云本地软件项目。 Containerd 、 Prometheus 和 Kubernetes 是 CNCF 维护的热门项目。

为什么边缘 AI 使用云计算?

云本机与边缘计算有何关联?为大规模公共云构建的工具能否使具有一个或两个节点的边缘位置受益?

简而言之,答案是肯定的。云本机架构提供的不仅仅是巨大的可扩展性。它还提供性能、恢复力和易管理性,这些都是 edge AI 的关键功能。

性能

在过去 15 年中,企业倾向于使用虚拟机( VM )将应用程序整合到更少的服务器上。但是虚拟化开销会降低应用程序性能。

边缘 AI 偏爱容器。在边缘,性能是王者。自动驾驶汽车必须在“看到”行人时猛踩刹车。容器以***金属性能运行。而且许多容器可以共享同一台服务器,从而整合应用程序,而无需虚拟化带来的性能开销。

Kubernetes 还可以通过优化工作负载布局来提高边缘 AI 性能。 CPU 管理策略为特定工作负载隔离 CPU。这减少了上下文切换和缓存未命中。设备插件框架将加速器(如 GPUFPGA )暴露在吊舱中。拓扑管理器将 CPU 、内存和加速器资源沿 NUMA 域对齐,从而减少昂贵的跨 NUMA 流量。

业务和管理

边缘人工智能数据中心 MIG ht 跨越数百个位置。云原生工具支持公共云的大规模可扩展性,管理员可以使用相同的工具来管理边缘 AI 数据中心。

Diagram shows multiple EGX servers with Helm charts connected to the cloud.

图 2 。边缘人工智能数据中心的高级体系结构

第一天的操作包括初始部署和测试。 Kubernetes 具有足够的灵活性,能够在第一天就支持不同的体系结构。

在一个极端,整个 edge 数据中心是一个 Kubernetes 集群。此体系结构需要在集中式 API 端点和远程工作者之间进行可靠通信。 API 端点通常是基于云的。

在另一个极端,每个边缘节点都是一个独立的集群,并维护自己的控制平面和应用程序。这种体系结构适用于间歇性或不可靠的集中式通信。

Kubernetes 还支持集群联合。联邦集群共享单一的应用程序配置源,但在其他方面是独立的。联合适用于松散耦合的边缘站点。例如,医院系统可以联合起来共享患者数据。

部署第一天之后,边缘数据中心管理将转移到第二天操作。更新、升级和监视是第二天的操作。自动化和远程第二天操作对于缺乏本地支持人员的边缘位置的稳定性和安全性至关重要。

云本机生态系统包括许多用于集中观察的流行工具。Prometheus是一个开源的监视和警报工具包。Grafana是一个开源的可观察性工具,可以在图形仪表板中显示数据。

软件生命周期管理也是第二天操作的一个重要方面。修补 VM 映像需要长时间的测试。容器与其依赖项捆绑在一起,并通过稳定的接口与内核交互。这使 CI / CD 和其他支持边缘快速变化的云本机实践成为可能。

应用弹性

弹性是指应用程序克服问题的能力。这是 cloud native 让 edge AI 受益的另一个领域。

云本地应用程序通常通过扩展提供恢复能力。同一应用程序的多个克隆在负载平衡器后面运行,当克隆失败时,服务将继续。

这种方法在应用程序跨越两个或多个节点的边缘 AI 部署中效果良好。但许多边缘人工智能数据中心每个位置只有一个节点。

Kubernetes 还支持单节点上的应用程序恢复能力。容器重启策略自动重新启动故障吊舱, Kubelet 可以使用活性探针检测需要重新启动的非故障条件。

edge AI 基础设施软件也应该具有弹性。Kubernetes 算子模式将基础设施管理置于自动驾驶状态,自动执行人工通常执行的任务。例如,在边缘节点上检测到内核升级的 Kubernetes 操作符将自动将节点的驱动程序重新编译为新的内核版本。

挑战

Cloud native 提供了弹性和性能,同时简化了操作。这些是边缘 AI 的关键考虑因素。然而,仍有一些领域必须继续发展云计算。

超低延迟边缘应用程序需要更好地了解底层硬件。例如,确定 CPU 中哪个内核的延迟最低。容器编排平台还希望改进多租户的工作负载隔离。云原生边缘 AI 的好处和挑战只是我们在即将到来的虚拟 GTC 人工智能会议十一月会议上探讨的边缘计算主题之一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10922

    浏览量

    213300
  • NVIDIA
    +关注

    关注

    14

    文章

    5087

    浏览量

    103936
  • 边缘计算
    +关注

    关注

    22

    文章

    3131

    浏览量

    49642
收藏 人收藏

    评论

    相关推荐

    智能传感器如何推动边缘人工智能普及化

    炙手可热的AI行业来说无疑具有非常重要的影响。随着近几年的快速发展,AI技术已经从边缘走向主流,从专业化走向普通用户。 图源:Nvidia官网 在过去,AI的应用仅限于数据中心等高功率计算设施集群。近几年,它已经扩展到工业运营的“边缘
    的头像 发表于 01-15 14:26 429次阅读
    看<b class='flag-5'>智能</b>传感器如何推动<b class='flag-5'>边缘人工智能</b>普及化

    人工智能对数据中心基础设施带来了哪些挑战

    (太瓦时),约占全球总用电量的 2%。在美国,拥有全球三分之一的数据中心,耗电量为 260 TWh,占总用电量的 6%。   预测未来具有挑战性,这取决于部署了多少非常耗电的图形处理单元(GPU)来应对人工智能技术的需求,当然还
    发表于 12-31 13:48 291次阅读
    <b class='flag-5'>人工智能对数据中心</b>基础设施带来了哪些挑战

    亚马逊科技发布全新数据中心组件

    近日,亚马逊科技宣布了一项重大创新,推出了一系列全新的数据中心组件。这些组件旨在满足新一代人工智能(AI)创新的需求,并帮助客户应对日益复杂且多变的应用场景。 亚马逊科技通过对电源
    的头像 发表于 12-24 15:05 269次阅读

    19位国际顶尖学者联袂撰写《重新审视边缘人工智能:机遇与挑战》

    19位国际顶尖学者联袂撰写《重新审视边缘人工智能:机遇与挑战》
    的头像 发表于 11-27 01:04 554次阅读
    19位国际顶尖学者联袂撰写《重新审视<b class='flag-5'>边缘人工智能</b>:机遇与挑战》

    嵌入式和人工智能究竟是什么关系?

    人工智能应用的实时响应。与此同时,嵌入式系统在边缘计算和物联网领域,也为人工智能的应用提供了广阔的空间。 在边缘计算中,嵌入式系统能够将人工智能
    发表于 11-14 16:39

    人工智能对数据中心的挑战

    在加密货币和人工智能/机器学习(AI/ML)等新兴应用的驱动下,数据中心的能耗巨大,并将快速增长以满足用户需求。根据国际能源署(IEA)的最新报告,2022 年数据中心的耗电量将达到 460 TWh
    的头像 发表于 11-13 16:05 459次阅读
    <b class='flag-5'>人工智能对数据中心</b>的挑战

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据,发现传统方法难以捕捉的模式和规律。这不仅极大地提高了
    发表于 10-14 09:12

    计算与数据中心AI处理器市场:从高速增长迈向应用驱动的新纪元

    能力支撑,还深刻影响着各行各业的发展轨迹。近日,知名市场研究机构Omdia发布的最新《计算和数据中心人工智能处理器预测》报告,为我们揭示了这一领域未来的发展趋势与挑战。
    的头像 发表于 08-29 16:04 602次阅读

    FPGA在人工智能中的应用有哪些?

    定制化的硬件设计,提高了硬件的灵活性和适应性。 综上所述,FPGA在人工智能领域的应用前景广阔,不仅可以用于深度学习的加速和计算的加速,还可以针对特定应用场景进行定制化计算,为人工智能技术的发展提供有力支持。
    发表于 07-29 17:05

    AI时代,我们需要怎样的数据中心?AI重新定义数据中心

    超过60%的中国企业计划在未来12至24个月内部署生成式人工智能。AI、模型的构建,将颠覆数据中心基础设施的建设、运维和运营。一个全新的数据中心智能化时代已经拉开序幕。
    发表于 07-16 11:33 808次阅读
    AI时代,我们需要怎样的<b class='flag-5'>数据中心</b>?AI重新定义<b class='flag-5'>数据中心</b>

    人工智能数据中心的新型连接解决方案

    支持新型人工智能数据中心架构的先进连接解决方案不断涌现。高速板对板连接器、下一代电缆、背板和近似集成电路连接器对电缆解决方案的运行速度高达224Gb/s-PAM4,将加速未来计算的发展。人工智
    的头像 发表于 06-13 08:26 655次阅读
    <b class='flag-5'>人工智能</b><b class='flag-5'>数据中心</b>的新型连接解决方案

    夏普讨论建立人工智能数据中心

    近日,夏普公司宣布与KDDI公司达成重要合作意向,双方将针对建立人工智能数据中心进行深入讨论。据悉,此次合作将围绕英伟达的人工智能计算平台和Supermicro平台展开,共同探索人工智能
    的头像 发表于 06-05 09:17 524次阅读

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V2)

    ://t.elecfans.com/v/27185.html *附件:语音对话机器人案例.pdf 人工智能 AI泛边缘智能安防实训 31分38秒 https://t.elecfans.com/v/25509.html
    发表于 05-10 16:46

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V1)

    机器人案例.pdf 人工智能 AI泛边缘智能安防实训 31分38秒 https://t.elecfans.com/v/25509.html *附件:泛边缘案例课.pdf
    发表于 04-01 10:40

    施耐德电气携手英伟达推进边缘人工智能和数字孪生技术突破性变革

    近日,全球能源管理与自动化领域的数字化转型专家施耐德电气宣布与英伟达达成合作,共同优化数据中心基础设施,携手推进边缘人工智能(AI)和数字孪生技术突破性变革。
    的头像 发表于 03-22 10:36 743次阅读