0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

奇异摩尔专用DSA加速解决方案重塑人工智能与高性能计算

奇异摩尔 来源:奇异摩尔 2024-09-19 11:45 次阅读

写在开头,奇异摩尔的 NDSA 互联系列产品基于高性能RoCEv2 RDMA引擎,是面向智算网络通信加速及无损数据传输的专用DSA加速解决方案。

本文部分内容来源于麦肯锡白皮书

随着摩尔定律下的晶体管缩放速度放缓,单纯依靠增加晶体管密度的通用计算的边际效益不断递减,促使专用计算日益多样化,于是,针对特定计算任务的专用架构成为计算创新的焦点。

在过去的几十年的时间里,半导体晶圆上的晶体管密度几乎每两年翻一番,这一趋势令人瞩目。但在过去几年中,晶体管缩放的速度显著放缓,比摩尔定律预测的速度落后了大约十倍。

2018年,著名计算机架构师约翰·亨尼斯西(John Hennessy)和大卫·帕特森(David Patterson)在图灵讲座中指出,半导体工艺创新的放缓将逐渐增加对架构创新的激励——即集成电路的设计方式,以执行计算任务。

“他们认为,通用计算架构(如CPU)固有的低效性将开始被专门针对特定计算任务的架构(也称为领域专用架构,DSAs)的计算能力和成本效益所取代 。”

与此同时,随着计算和数字化在云计算(人工智能和高性能计算)、网络、边缘、物联网(IoT)和自动驾驶等众多应用领域中普及,高度领域专用的计算工作负载正在为DSAs提供有意义的性能优势。大型语言模型(生成式AI的核心引擎),例如ChatGPT,在高容量的AI工作负载中提供了进一步的专业化,这促进了进一步的硬件专业化。 DSA(domain-specific architecture)为特定应用领域开发的硬件和软件的商业潜力是巨大的。专用的图形处理单元 (GPU) 和张量处理单元 (TPU) 已经在数据中心获得了重要的市场份额,它们在 AI 工作负载学习和推理方面的表现优于 CPU。使用GPU和TPU对某些应用的性能提升是非常显著的,特定工作负载的可以实现15 到 50 倍的加速。此外,在汽车领域,来自领先供应商的定制的专用于某些计算场景的DSA硬件也提供了安全支持日益提高的自动驾驶水平所需的低延迟、高性能推理。

wKgaombrnnKAGY13AAKCgBR1DvE660.png

随着 DSA 扩展到其他应用领域,麦肯锡咨询估计到 2026 年,DSA 将占约 900 亿美元的收入(约占全球半导体市场的 10% 至 15%),高于 2022 年的约 400 亿美元。因此,我们看到在这个方向的硬件类的风险投资显着增加也就不足为奇了。

01 算力革命下的高性能网络DSA

随着人工智能及高性能计算的高速发展,服务器集群的瓶颈逐渐从单CPU、GPU、APU的算力转换到硬件间的互联能力。传统的数据中心架构中包含CPU、内存、存储和网络等组件,但CPU目前已经公认不再是运行基础设施功能的最佳位置了。对于下一代数据中心而言,面向网络加速的DSA将扮演重要的角色,根据不同应用场景的需求,加速数据传输。同时,以太网速度从25G增加到100G、200G、400G,再到800G,甚至还有持续增长的趋势,超大规模数据中心的硬件架构在逐渐转变。

据估计,对于超大规模数据中心来说,大约有一半的CPU被用在了非创收型任务上。网络DSA可以承担大部分繁重的工作,将CPU解放出来,专注于创收的应用处理上。同时,由于功能和作用不同,北向网络和高带宽域在设计时侧重点不同。北向网络侧重于网络控制与管理,主要是网络控制器与上层应用之间的接口通信。高带宽域网络侧重于数据传输性能,旨在提供高速度、低延迟的网络连接。基于RoCE的RDMA技术,兼容现有的以太网基础设施,拥抱开放生态,是业界解决高带宽域网络与北向网络数据传输的重要解决方案。

02 Chiplet设计方法与DSA的完美结合

结合Chiplet设计方法学与DSA的设计,可以构建出高效、灵活且高度定制化的计算平台。Chiplet设计方法学通过将处理器设计拆分为多个独立的Chiplet,每个Chiplet可以针对特定功能进行优化。这样可以在设计、制造和测试中提高灵活性。同时,不同的Chiplet分工明确,可以专门处理不同的任务,例如CPU核心、内存控制器、I/O接口等。而DSA针对特定计算任务进行优化,例如生成式人工智能、图形处理、网络处理等,相比于通用处理器,DSA在其特定领域内具有更高的性能和能效比。

通过Chiplet方法学,可以将多个DSA集成到一个系统中,创建一个高度定制化的平台。比如,一个系统可以包含CPU、GPU、TPU、DPU等Chiplet,根据应用需求灵活组合。在这一背景下,组件之间的高速可连接对于确保顺利快速的数据传输至关重要。互联标准、带宽、延迟和低延迟是关键指标。

03奇异摩尔NDSA网络加速与无损数据传输解决方案

在智算中心领域,奇异摩尔 的NDSA互联系列产品复用以太网基础设施,基于高性能RoCEv2 RDMA引擎,面向智算网络通信加速及无损数据传输的专用DSA加速解决方案。

AI原生智能网卡

奇异摩尔的Kiwi NDSA-SNIC AI原生智能网卡针对网络数据传输,基于RoCE V2 RDMA技术,自适应网络调度算法,搭载可编程加速核心SDPU,高达800G传输带宽,实现Tb级万卡集群无损数据传输。

高性能网络加速芯粒

奇异摩尔的高性能网络加速芯粒 – Kiwi NDSA互联芯粒针对高带宽域数据传输,基于RoCEv2 RDMA技术,单芯粒传输带宽高达800G,携带UCIe-D2D芯粒可扩展互联接口,实现集群内TB级的高速通信。

写在最后,无论是在高性能计算领域还是在人工智能领域,我们会预见更多加速数据传输的DSA问世。它们通过提供高吞吐量效率,计算节点之间的超快速互连,或提升人工智能训练的效率,为半导体价值链的参与者及其客户带来更多的革新和挑战。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    450

    文章

    49614

    浏览量

    417068
  • 人工智能
    +关注

    关注

    1787

    文章

    46041

    浏览量

    234909
  • 奇异摩尔
    +关注

    关注

    0

    文章

    39

    浏览量

    3279

原文标题:Kiwi Talks | DSA专用领域芯片正在重塑人工智能与高性能计算

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    FPGA在人工智能中的应用有哪些?

    定制化的硬件设计,提高了硬件的灵活性和适应性。 综上所述,FPGA在人工智能领域的应用前景广阔,不仅可以用于深度学习的加速和云计算加速,还可以针对特定应用场景进行定制化
    发表于 07-29 17:05

    人工智能与大模型的关系与区别

    在科技日新月异的今天,人工智能(AI)已成为推动社会进步的重要力量。而在人工智能的众多分支中,大模型(Large Models)作为近年来兴起的概念,以其巨大的参数数量和强大的计算能力,在多个领域展现出了非凡的潜力。本文旨在深入
    的头像 发表于 07-04 16:07 1903次阅读

    奇异摩尔上海总部进驻上海浦东科海大楼

    。 三年风雨兼程  三年春华秋实 奇异摩尔于2021年在上海创立,依托于Chiplet和RDMA高性能网络互联技术,旨在打造了一整套全栈式AI智算集群互联架构及产品解决方案。 过去年的
    的头像 发表于 07-01 18:57 911次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>上海总部进驻上海浦东科海大楼

    三星电子将为代工业务提供人工智能解决方案

    三星电子公司近日宣布,将为其代工客户提供一套全面的“一站式”人工智能解决方案,以满足市场对高性能、低功耗人工智能芯片技术的迫切需求。
    的头像 发表于 06-15 09:42 444次阅读

    人工智能数据中心的新型连接解决方案

    支持新型人工智能数据中心架构的先进连接解决方案不断涌现。高速板对板连接器、下一代电缆、背板和近似集成电路连接器对电缆解决方案的运行速度高达224Gb/s-PAM4,将加速未来
    的头像 发表于 06-13 08:26 383次阅读
    <b class='flag-5'>人工智能</b>数据中心的新型连接<b class='flag-5'>解决方案</b>

    高性能计算集群的能耗优化

    人工智能、大数据分析等。随着高性能计算集群的规模和性能的不断提升,其能耗问题也日益突出。高性能计算
    的头像 发表于 05-25 08:27 228次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群的能耗优化

    奇异摩尔携手SEMiBAY Talk 邀您畅谈互联与计算

    2024年5月25日(本周六)19:30,由深圳市半导体与集成电路产业联盟(SICA)主办的 SEMiBAY Talk“Chiplet 与先进封装技术和市场趋势”将在线上举行。奇异摩尔产品及解决方案
    的头像 发表于 05-20 18:31 829次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>携手SEMiBAY Talk 邀您畅谈互联与<b class='flag-5'>计算</b>

    摩尔线程携手瑞莱智慧共同打造人工智能、大模型的整体解决方案

    近期,摩尔线程与北京瑞莱智慧科技有限公司(简称:瑞莱智慧)签署战略合作协议,双方将依托各自在人工智能领域的优势与资源,共同打造人工智能、大模型的整体解决方案,共筑安全可控大模型新生态。
    的头像 发表于 04-08 11:32 820次阅读
    <b class='flag-5'>摩尔</b>线程携手瑞莱智慧共同打造<b class='flag-5'>人工智能</b>、大模型的整体<b class='flag-5'>解决方案</b>

    Cadence与NVIDIA联合推出利用加速计算和生成式AI重塑设计

    中国上海,2024 年 3 月 25 日——楷登电子(美国 Cadence 公司,NASDAQ:CDNS)近日宣布,公司将深化与 NVIDIA 在 EDA、系统设计与分析、数字生物学和人工智能领域的多年合作,推出两款变革性解决方案,利用
    的头像 发表于 03-25 14:36 461次阅读

    Achronix提供由FPGA赋能的智能网卡(SmartNIC)解决方案来打破智能网络性能极限

    随着人工智能/机器学习(AI/ML)和其他复杂的、以数据为中心的工作负载被广泛部署,市场对高性能计算的需求持续飙升,对高性能网络的需求也呈指数级增长。
    的头像 发表于 12-21 14:52 502次阅读

    奇异摩尔以互联解决方案,共建可持续、开放的芯粒生态

    集成电路、计算机、数学、物理、化学等跨学科的探讨,探索构建自主创新的集成芯片和芯粒关键共性技术和可持续发展生态新路径。     奇异摩尔联合创始人兼产品及解决方案副总裁祝俊东受邀,在架
    的头像 发表于 12-21 11:13 1197次阅读
    <b class='flag-5'>奇异</b><b class='flag-5'>摩尔</b>以互联<b class='flag-5'>解决方案</b>,共建可持续、开放的芯粒生态

    人工智能服务器高性能计算需求

    人工智能(AI)服务器是一种专门为了运行人工智能应用和提供大数据处理能力而设计的高性能计算机。它既可以支持本地应用程序和网页,也可以为云和本地服务器提供复杂的AI模型和服务。
    的头像 发表于 12-08 09:44 392次阅读

    奇异摩尔与智原科技联合发布 2.5D/3DIC整体解决方案

    作为全球领先的互联产品和解决方案公司,奇异摩尔期待以自身 Chiplet 互联芯粒、网络加速芯粒产品及全链路解决方案,结合智原全面的先进封装
    的头像 发表于 11-12 10:06 738次阅读

    后摩智能与奇异摩尔正式签署战略合作协议

      2023年9月26日,存算一体与Chiplet两大架构再度上演双剑合璧之作,后摩智能与奇异摩尔正式签署战略合作协议,双方将基于存算一体与Chiplet的技术优势,携手打造行业解决方案
    的头像 发表于 09-27 10:19 836次阅读

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在
    发表于 09-21 11:09