0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

今天发布!详解赛灵思加速卡Alveo U50的轻与重

坚白 来源:电子发烧友网 作者:陆楠,电子发烧友 2019-08-07 09:01 次阅读
目前,数据中心在异构计算和算法标准上不断变化,越来越多的应用领域需要专用的架构,使得硬件能够和算法去进行匹配以达到最佳运行效果或者是提高它的运行速度。网络上有很多不同的数据,这些数据在运行过程当中有不同的要求,而且网络自身也在不断迭代,计算、网络和存储对加速的要求都在水涨船高。对于硬件而言,理想的方式是能在不改变硬件的情况下,加速任何工作负载,并能降低总体拥有成本。
针对这一需求趋势,去年10月份的时候,赛灵思推出了Alveo系列加速卡。赛灵思数据中心业务部产品规划和市场营销总监Jamon Bowen将这一系列产品的规划目的总结为三个:快速、灵活应变和方便易用。即高吞吐量同时具有超低时延,能够为多种工作负载进行加速,并且可以运用于云和本地各种场景。Alveo系列包括U200、U250和U280,区别主要是FPGA中的LUT规模和总线资源。今天,该公司宣布推出了Alveo系列最新的一款加速卡Alveo U50。

轻——轻量级加速

和该系列之前的产品不同,Alveo U50是业界首款轻量级PCIe Gen4自适应计算加速卡,并且面向所有服务器、各种云和边缘的数据中心应用,包括网络和存储加速。“这是之前的产品做不到的。”Bowen说。
图:从赛灵思提供的资料看,U50似乎是U280的迷你版。
Alveo U50支持PCIe Gen4这一最新的服务器总线和CCIX互联标准,不同于GPU加速器的尺寸,U50要小的多,“GPU加速器的尺寸适合电脑,但不适用于网络和存储,”Bowen说,“采用赛灵思UltraScale+架构以及集成超高带宽的HBM2存储器技术大大减少了U50的尺寸。”
采用HBM2这种片上存储不仅仅是出于体积的考虑,还在于这能提升性能——HBM性能是DDR的10倍。U50内置8GB HBM2,可实现超过400Gbps的数据传输速度。PCIe Gen4也是目前最快的总线技术,这些都是存储加速的要素。在网络端口方面,U50的QSFP28端口可以实现100Gbps的网络连接,并支持多种前沿应用,如VMe-oF(NVM Express over Fabrics)、解耦计算存储和专业金融服务应用。满足所有这些性能只需要不到75W的功耗,这可以让很多应用不再为功耗预算而担心。
在一组针对语音翻译(深度学习推断加速)、数据库分析(数据分析加速)、数据压缩(计算存储加速)、电子交易(网络加速)和金融建模(网格计算)的加速测试中,与GPU和CPU加速相比,U50的表现优异。其中,语音翻译的时延降低25倍,吞吐量扩大10倍,在翻译性能方面,和英伟达T4 相比,U50 性能提升高达10倍;在运行TPC-H Query基准测试(数据库分析)时,相比CPU,U50每小时吞吐量提升4倍,运营成本降低3倍;在数据压缩上,U50将压缩/解压缩吞吐量提高了20倍,实现了更快的Hadoop和大数据分析,同时相比仅CPU节点将每节点成本降低了40%;在电子交易中,U50相比仅CPU的10us延时,能将时延降低20%,交易时间不到500ns;在金融建模时,运行蒙特卡洛模拟,U50的功效相比GPU提升了7倍。
图:U50在吞吐量,延迟和功效方面实现了10-20倍的改善
总的来说,U50在吞吐量,延迟和功效方面实现了10-20倍的改善。“我们的战略是致力于让赛灵思灵活应变的加速技术应用于数据中心的所有领域,具体来说就是计算、网络和存储,”Bowen说,“所有的计算工作负载都是这三个领域的一部分,这也是我们看到Alveo可以大展宏图的地方。”

重——两个重要堆栈

计算、网络和存储为什么需要加速?因为诸如AlexNet、GoogleNet、DenseNet这些网络结构都需要不同的硬件架构来实现高吞吐量、低时延和高效率。对于应用而言,加速可以灵活适应不同的需求。而数据中心要优化性能,需要定制数据路径、定制精度和定制存储器层级,没有比可编程的硬件更适合来进行定制化的加速了。不过,对于数据中心开发者而言,FPGA编程是个令人头痛的事情。
“我们从数据中心的客户那里听到的一个最大的抱怨就是FPGA的编程非常困难,”Bowen说,“Alveo提供开放的平台和开发环境,让开发者能够更加便捷地使用,随着越来越多的开发者到这个平台上来开发,会有更多的云和相关产品加入,并且能够实现原来只有在软件部分才有可能实现的硬件IP的灵活应变能力。”
对于赛灵思而言,这个开放平台正在形成一个解决方案的堆栈,好消息是,自去年10月份推出Alveo以来,目前已发布的应用已经是当初的2倍,而其培训的开发者已经是当初的4倍。
图:解决方案堆栈
开发堆栈解决了FPGA加速卡的开发难题,接下来就是大规模部署落地的难题。Alveo系列的应用领域包括数据分析、视频与图象处理、机器学习、生命科学和金融计算——不仅是云的覆盖,还要部署落地。在诸多调动IT业者积极性的因素中,“充分商业化的标准化产品”是重要的一个,这使得赛灵思的标准产品的开源框架很容易被Kubernetes和docker这类免费的微服务内容平台连接。
“因为我们是一个非常标准化的产品,所以Kubernetes可以在系统内反映出Alveo插件,开发者也可以把它和docker配合起来,通过对Alveo进行编程而在系统中体现出加速应用。”Bowen解释道,“所有编排、云管理和应用都和这些免费的生态系统结合,如果没有这样一个标准化的产品配置,客户可能需要花费大量的投资才能够实现这样一个功能,这对于一些超大规模数据中心的应用来说是非常有必要的,既可以在云端,也可以用Alveo在本地进行加速,而且是一个非常开放式的框架,可以进行全面的加速。”
这个生态就是一个大规模部署堆栈,赛灵思在其中开发了一个标准框架,然后提供Alveo产品,让开发者像加速软件那样给服务器加速——重要的是,通过开发这个标准框架,赛灵思决定了应用场景的加速方式。
图:大规模部署堆栈
据悉,赛灵思选择在今天(8月7日)发布Alveo U50,是因为这两天(8月6-8日),闪存峰会(Flash Memory Summit (FMS) 2019)正在美国加州圣克拉拉会议中心举办,赛灵思执行副总裁兼数据中心部总经理Salil Raje将发表有关高速存储系统加速的的主题演讲,该公司同时也会在现场演示这款最新的产品。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 赛灵思
    +关注

    关注

    32

    文章

    1794

    浏览量

    131469
  • 加速卡
    +关注

    关注

    1

    文章

    61

    浏览量

    10989
收藏 人收藏

    评论

    相关推荐

    AMD Alveo媒体加速产品组合SDK 1.2.1发布

    我们很高兴地宣布AMD Alveo 媒体加速产品组合( AMA )SDK 1.2.1 版本发布,从而进一步扩展 AMD Alveo MA35D 媒体
    的头像 发表于 12-18 16:01 341次阅读

    S7t-VG6 VectorPath加速卡的特性和功能

    S7t-VG6 VectorPath加速卡是Achronix公司联合BittWare公司(Molex旗下的领先企业级FPGA加速器产品供应商)推出的一类全新的、面向高性能计算和数据加速应用的FPGA
    的头像 发表于 11-14 11:19 365次阅读

    U50的AMD Vivado Design Tool flow设置

    AMD Alveo 加速卡使用有两种流程,AMD Vitis Software Platform flow 和 AMD Vivado Design Tool flow。比较常见的是 Vitis
    的头像 发表于 11-13 10:14 267次阅读
    <b class='flag-5'>U50</b>的AMD Vivado Design Tool flow设置

    AMD Alveo V80计算加速器网络研讨会

    V80 计算加速卡由 AMD Versal HBM 自适应 SoC 提供支持,具有 Alveo 产品系列中最高的逻辑密度、内存带宽、网络吞吐量和 DSP 计算能力。
    的头像 发表于 11-08 09:35 264次阅读

    AMD 以全球极快的纤薄尺寸电子交易加速卡扩展 Alveo 产品组合,助力广泛且具性价比的服务器部署

    — AMD Alveo UL3422 加速卡为高频交易员在争夺最快交易执行的竞争中提供了优势,同时降低了进入门槛 —   2024 年 10 月 14 日,加利福尼亚州圣克拉拉 — AMD(超威
    发表于 10-16 14:35 131次阅读
    AMD 以全球极快的纤薄尺寸电子交易<b class='flag-5'>加速卡</b>扩展 <b class='flag-5'>Alveo</b> 产品组合,助力广泛且具性价比的服务器部署

    AMD 以全球极快的纤薄尺寸电子交易加速卡扩展 Alveo 产品组合,助力广泛且具性价比的服务器部署

    — AMD Alveo UL3422 加速卡为高频交易员在争夺最快交易执行的竞争中提供了优势,同时降低了进入门槛 —   2024 年 10 月 14 日,加利福尼亚州圣克拉拉 — AMD(超威
    发表于 10-16 14:16 182次阅读

    AMD推出新款纤薄尺寸电子交易加速卡

    AMD(超威,纳斯达克股票代码:AMD)今日宣布推出 AMD Alveo UL3422 加速卡 ,这是其创纪录的加速卡系列1的最新成员,专为超低时延电子交易应用而设计。AMD Alveo
    的头像 发表于 10-16 09:14 497次阅读

    大模型向边端侧部署,AI加速卡朝高算力、小体积发展

    电子发烧友网报道(文/李弯弯)AI加速卡是专门用于处理人工智能应用中的大量计算任务的模块。它集成了高性能的计算核心和大量的内存,旨在加速机器学习、深度学习等算法的计算过程。当前,AI加速卡市场呈现出
    的头像 发表于 09-17 00:18 3722次阅读

    EPSON差分晶振SG3225VEN频点312.5mhz应用于AI加速卡

    AI加速卡,通常也被称为AI算力,是一种专为加速人工智能(AI)应用和算法而设计的硬件设备。AI加速卡在数据中心、云计算、边缘计算和高性能计算(HPC)环境中广泛应用,用于
    发表于 09-10 14:56 0次下载

    借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

    对于大规模数据处理,最佳性能不仅取决于原始计算能力,还取决于高存储器带宽。 因此,全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计,这些应用需要 FPGA 硬件
    发表于 05-16 14:09 258次阅读
    借助全新 AMD <b class='flag-5'>Alveo</b>™ V80 计算<b class='flag-5'>加速卡</b>释放计算能力

    AMD Alveo V80计算加速卡实现量产

    AMD公司近日迎来了一个重要的里程碑,其专为大型数据集和内存受限型应用设计的Alveo V80计算加速卡,已正式进入量产出货阶段。这款创新产品针对高性能计算(HPC)、数据分析、金融、网络安全以及计算存储等关键领域,展现了强大的应用潜力。
    的头像 发表于 05-16 11:40 657次阅读

    AMD正式量产Alveo V80计算加速卡,优化大数据集中的内存瓶颈问题

    适用场景包括HPC、数据分析、金融、网络安全及计算存储等领域。据AMD官网上显示,计算加速卡建议零售价高达9495美元(当前折合人民币约为68,744元)。
    的头像 发表于 05-15 15:51 608次阅读

    英伟达发布最强AI加速卡Blackwell GB200

    英伟达在最近的GTC开发者大会上发布了其最新、最强大的AI加速卡——GB200。这款加速卡采用了新一代AI图形处理器架构Blackwell,标志着英伟达在AI图形处理领域迈入了一个新的里程碑。
    的头像 发表于 03-20 11:38 1226次阅读

    英伟达发布最强AI加速卡GB200,开启新一代AI图形处理时代

    英伟达正式发布了其最新、也是迄今为止最强大的AI加速卡——GB200。这一重大发布标志着英伟达在AI图形处理领域迈入了一个新的里程碑。
    的头像 发表于 03-19 11:26 1307次阅读
    英伟达<b class='flag-5'>发布</b>最强AI<b class='flag-5'>加速卡</b>GB200,开启新一代AI图形处理时代

    今日看点丨英伟达发布最强 AI 加速卡--Blackwell GB200;三星面临罢工 存储市场供需引关注

    1. 英伟达发布最强 AI 加速卡--Blackwell GB200 ,今年发货   3 月 19 日,英伟达发布最强 AI 加速卡--Blackwell GB200,今年发货。英伟达
    发表于 03-19 11:08 1293次阅读