0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思正式推出Versal Premium 可提供比当前FPGA高达三倍的吞吐量

半导体动态 来源:芯智讯 作者:浪剑客 2020-03-12 09:18 4617次阅读

2018年10月16日,FPGA大厂赛灵思(Xilinx)在北京的“Xilinx开发者大会 ”(XDF)上,发布了全球首款自适应计算加速平台(ACAP)芯片系列Versal,并发布了AI Core系列和Prime系列。去年,这两个系列产品也已经成功推向了市场。

今天(3月11日),赛灵思举行线上发布会,正式推出了Versal ACAP产品组合的第三大产品系列—— Versal Premium。

赛灵思认为,随着来自多元化应用和工作负载(比如智能设备、视频流、物联网、企业等)的数据爆炸性增长,这也使得核心网正面临巨大的压力。

数据显示,2019年区域流量容量提升了100倍,带宽年复合增长率达到了51%。

随着数据的爆炸性增长,对于整个网络基础设施提出了更高的要求,这也加速驱动了网络转型。而在这个转型过程当中,我们可以看到三个趋势:

1、下一代核心网络加速扩展。

根据ABI Research数据显示,2020年-2024年5G核心网年复合增长率预计为313%。

2、安全已成为网络运营商最高优先级的问题。

ISH Markit的研究显示,对于网络运营商来说,过去性能、扩展性、成本一直是运营商主要关注的问题,而现在,安全性已经成为了网络运营商最为关注的问题。

3、随着数据的增长,对于计算能力与带宽的需求越来越高。

我们可以看到,现在网络的带宽的增长非常的迅速,但是,随着摩尔定律的放缓甚至是趋于消亡,芯片的计算能力越来越跟不上了。根据赛灵思的估算,2018年之时,服务器端口速度的增长已经超过了摩尔定律对于服务器CPU性能所带来的增长,并且差距正在进一步扩大。

在此背景之下,为了加速运营商的网络转型,赛灵思推出了Versal Premium ACAP系列产品,其具备了高度集成且功耗优化的网络硬核,是业界带宽最高、计算密度最高的自适应平台。专为在散热条件和空间受限的环境下运行最高带宽网络,以及需要可扩展、灵活应变应用加速的云提供商而设计。

Versal Premium ACAP系列详解

我们都知道,2018年赛灵思推出的Versal系列是业界首款自适应计算加速平台( ACAP ),是一个功能远超常规芯片架构的革命性全新异构计算器件类别。而据赛灵思介绍,其去年就已经向客户交付的Versal AI Core系列和Versal Prime系列,已经获得了几百家客户的采用,反响很好,目前正在加速生产。

而此次赛灵思推出的全新Versal Premium则是Versal Prime系列的升级款版,是针对网络基础设施推出的旗舰级产品,采用台积电7nm工艺制程打造而成,融软件可编程能力与动态可配置硬件加速、预制连接和安全功能为一体,为加快产品上市进程提供了强大引擎。

作为 Versal ACAP 的最新产品系列, Versal Premium 系列可提供比当前FPGA高达三倍的吞吐量,且拥有高度集成的软件/硬件平台,内置了以太网接口、Interlaken和加密引擎,以打造快速、安全的网络。该系列还提供了当前部署主流 FPGA 两倍的计算密度,同时还面向持续扩展的多元化且不断演进的云工作负载及网络工作负载,提供了灵活应变的能力。

Versal Prime系列

具体来说,与之前的Versal Prime系列相比,Versal Premium系列在其原有的灵活多变的平台(集成了Arm应用处理器内核和实时处理器内核、自适应硬件、DSP引擎、高速片上可编程网络等等)上,突破性地集成了功耗优化的网络硬核(ASIC),包括:400G高速加密引擎、600G Interlaken硬核、600G以太网硬核、112G PAM4收发器、带有DMA的PCIe 5.0、CCIX。

Versal Premium系列

据赛灵思介绍,Versal Premium系列所提供的网络IP集成,提供了等效22个16nm FPGA的逻辑密度,极大缩减了开发者在设计基础架构与连接上的投入,可以使得开发者将更多的精力专注于差异化。

同时,这也使得Versal Premium系列能够超越摩尔定律的局限,实现新一代的带宽与处理能力,并且能够显著降低资本支出与运营成本。

前面提到,Versal Premium系列所集成的一系列功耗优化的网络硬核,提供了等效22个16nm FPGA的逻辑密度,这也意味着Versal Premium系列可以释放更多的逻辑用于个性化定制。

根据赛灵思公布的资料显示,其Virtex UltraScale+ VU9P内部的20万个LUT被用于了控制器、存储器、PCIe接口等基础设施(包括4个存储器、4个控制器和一个PCIe+DMA),而相比之下,Versal Premium系列直接将这些作成了网络硬核,使得其基础设施对于内部的LUT的消耗为0。可以帮助客户降低异构成本,更好的专注于差异化。

另外,在易用性方面,赛灵思面向各种类型的开发人员提供了丰富的软硬件集成平台,可以让他们使用自己熟悉的框架和工具来进行开发。

对于数据科学家来说,可以通过TensorFlow、Caffe、PyTorch等同用框架来利用Versal Premium系列;软件开发者也可通过赛灵思去年推出的Vitis统一开发平台来使用Versal Premium系列;而硬件开发者则可以通过VIVADO平台来使用Versal Premium系列。

赛灵思表示,下一代基础设施需要更大的带宽密度,且方案受限于现有的外形尺寸、功耗和材料,另外,数据中心的占地面积也是有限的。这就要求,下一代的基础设施需要功耗优化的高吞吐量与计算量。

Versal Premium系列所集成的112G PAM4收发器、400G高速加密引擎、600G Interlaken硬核、600G以太网硬核、带有DMA的PCIe Gen5&CCIX等硬核IP,不仅能够提供功能优化的高带宽密度,提供自适应硬件的灵活应变性,还可适合AI和ML,可以帮助客户系统适应不断变化的算法和安全威胁。

随着 5G 网络投入运营,网络流量大幅增长,导致现有空间和功耗范围内功耗优化吞吐量与计算密度的需求不断提高。为支持业界应对这一挑战,Versal Premium 系列提供了高达 9Tb/s 的可扩展、自适应串行带宽。具体方法是将 112G PAM4 收发器与集成的网络功能模块用于核心网、城域网和数据中心互联( DCI )基础设施,将每端口带宽密度提高两倍,并降低时延高达 50%。

另外,在当前400G网络的发展与部署上,58Gb/s的PAM4收发器就足以应对,而Versal Premium系列所集成的112Gb/s PAM4收发器则可在向下兼容的基础上,同时可面向未来的单通道100G光通信和800G网络基础设施的发展需求。并且可兼容更具挑战性的铜缆线和基板。

Versal Premium系列的通道化以太网硬核能够以最小占板空间提供高达5Tb/s的可扩展以太网吞吐量,可适用于下一代核心网400G和800G基础设施,支持多速率、多标准;支持1.8Tb/s现有的Interlaken协议下的芯片间的互联通信;支持1.6TB/s加密线路速率吞吐量(拥有硬化的400G加密引擎),并支持 AES-GCM-256/128、MACsec 和 IPsec 。

Versal Premium系列是全球逻辑密度最高的7nm可编程逻辑平台,支持硬件差异化、标准演进以及AI/ML。为开发者提供了很大的差异化设计且与未来兼容:如带内网络遥测、vRAN,且适应各种标准与协议;拥有网络异常检测AI:支持入侵检测、恶意软件识别,应对新兴威胁的自适应AI算法,赛灵思随机森林算法IP;配置与网络性能AI:自动检测与性能瓶颈纠正,自动配置,最大限度延长正常运行时间。

根据赛灵思提供的数据显示,Versal Premium系列拥有业界领先的多太比特吞吐量,相比赛灵思Virtex UltraScale+(VU13P)提升了5倍以上。

在能效方面,Versal Premium系列可以低于100瓦的功耗提供单芯片800G DCI(数据中心互联)吞吐量,与前代的Virtex UltraScale+相比,功耗降低了60%。在数据中心的应用当中,Versal Premium与前代的FPGA相比,可以提供2倍的带宽密度,这也意味着,在带宽相同的情况下,Versal Premium的机柜空间占用只有前代FPGA的一半。

与此同时,Versal Premium系列还支持以嵌入式方式将预制连接与硬核集成到现有云基础设施中。从基因组学、数据分析和视频转码,到针对语音和图像识别的 AI 推断,Versal Premium 提供了高度集成的云就绪平台,为多元化的工作负载提供突破性能。

具体到AI性能方面,Versal Premium系列在NeatNet50(224 x 224)图像分类模型下的性能是英伟达Tesla V100的1.6倍,是英伟达Tesla T4的2.3倍;在Yolov2(608×608)对象检测模型下,性能分别是英伟达V100和T4的4.6倍和7.7倍;在异常检测AI方面(随机森林算法),性能是英特尔Xeon的65倍。

另外,存储器也是计算加速的一个重要瓶颈。Versal Premium系列不仅拥有1Gb的紧密耦合的存储器,可以改善性能,降低功耗和延时,同时内部还集成了LUTRAM、块RAM、UltraRAM,以及高速片上网络、硬化的内存控制器,可以提供高达123TB/s的片上存储器带宽,分别是英伟达Tesla V100和T4 GPU的9倍和25倍。而将超过123TB/s 的片上存储器带宽与可定制存储器层级相结合,能够减少数据移动从而消除相应的关键瓶颈。

赛灵思表示,Versal Premium ACAP解锁了GPU无法企及的性能。

产品与供货

赛灵思Versal Premium系列提供了7款产品,系统逻辑单元从最小160万个到最高740万个;自适应引擎LUT数量从最低72万个到最高340万个。

据介绍,Versal Premium 系列将于 2021 年上半年开始为早期用户提供样品。目前已提供文档,客户可立即使用 Versal Prime 评估套件开始原型设计。Versal Prime 器件与 Versal Premium 器件拥有众多相同的架构模块,支持引脚迁移至 Versal Premium。

责任编辑:wv

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1643

    文章

    21929

    浏览量

    612833
  • 赛灵思
    +关注

    关注

    33

    文章

    1795

    浏览量

    132067
收藏 人收藏
    相关推荐
    热点推荐

    数据吞吐量提升!面向下一代音频设备,蓝牙HDT、星闪、Wi-Fi、UWB同台竞技

    电子发烧友网报道(文/莫婷婷)音频设备数据吞吐量的提升是当前无线通信领域的一个重要发展趋势,蓝牙、Wi-Fi和UWB作为种主要的无线通信技术,在这一趋势中扮演着关键角色。   数据吞吐量
    的头像 发表于 12-25 01:22 2692次阅读

    如何在Visual Studio 2022中运行FX3吞吐量基准测试工具?

    我正在尝试运行 John Hyde 的书“SuperSpeed by Design”中的 FX3 吞吐量基准测试工具。 但是,我面临一些困难,希望得到任何指导。 具体来说,我正在使用 Visual
    发表于 05-13 08:05

    第二代AMD Versal Premium系列SoC满足各种CXL应用需求

    第二代 AMD Versal Premium 系列自适应 SoC 是一款多功能且可配置的平台,提供全面的 CXL 3.1 子系统。该系列自适应 SoC 旨在满足从简单到复杂的各种 CXL 应用需求
    的头像 发表于 04-24 14:52 228次阅读
    第二代AMD <b class='flag-5'>Versal</b> <b class='flag-5'>Premium</b>系列SoC满足各种CXL应用需求

    高通吞吐量超高精度加工

    是一款工业超短脉冲 (USP) 激光器,可提供高功率 (100 W) 绿光输出和始终如一的光束质量组合。因此它能够支持需要高吞吐量的要求严格的高精度材料加工应用。 高通量太阳能电池划片
    的头像 发表于 02-19 06:21 240次阅读
    高通<b class='flag-5'>吞吐量</b>超高精度加工

    低温失效的原因,有没有别的方法或者一些见解?

    低温失效的原因,有没有别的方法或者一些见解。就是芯片工作温度在100°--40°区间,然后呢我们到了0°以下就不工作了,然后在低温的情况下监测了电流和电压都正常,频率也都正常,频率不是F
    发表于 12-30 16:28

    ADC芯片的采样率为100MSPS,位宽16位,那么吞吐量是多少?

    例如ADC芯片的采样率为100MSPS,位宽16位,那么吞吐量是多少? 用差分LVDS和FPGA相连,FPGA的时钟速率多少能够满足要求/?
    发表于 12-18 08:49

    AMD推出Versal Premium Series Gen 2,这是业界第一个支持CXL 3.1和PCIe Gen6的FPGA平台。

    AMD推出Versal Premium Series Gen 2,这是业界第一个支持CXL 3.1和PCIe Gen6的FPGA平台。   AMD为数据中心、航空航天、通信和T M市
    的头像 发表于 11-21 15:59 1074次阅读
    AMD<b class='flag-5'>推出</b>了<b class='flag-5'>Versal</b> <b class='flag-5'>Premium</b> Series Gen 2,这是业界第一个支持CXL 3.1和PCIe Gen6的<b class='flag-5'>FPGA</b>平台。

    AMD推出第二代Versal Premium系列

    近日,AMD(超威,纳斯达克股票代码:AMD )今日宣布推出第二代 AMD Versal Premium 系列,这款自适应 SoC 平台旨在面向各种工作负载提供最高水平系统加速。第二代
    的头像 发表于 11-13 09:27 705次阅读

    TMS320VC5510 HPI吞吐量和优化

    电子发烧友网站提供《TMS320VC5510 HPI吞吐量和优化.pdf》资料免费下载
    发表于 10-16 09:35 0次下载
    TMS320VC5510 HPI<b class='flag-5'>吞吐量</b>和优化

    TMS320C6474模块吞吐量

    电子发烧友网站提供《TMS320C6474模块吞吐量.pdf》资料免费下载
    发表于 10-15 13:52 0次下载
    TMS320C6474模块<b class='flag-5'>吞吐量</b>

    TMS320C6474通用总线架构(CBA)吞吐量

    电子发烧友网站提供《TMS320C6474通用总线架构(CBA)吞吐量.pdf》资料免费下载
    发表于 10-15 10:29 0次下载
    TMS320C6474通用总线架构(CBA)<b class='flag-5'>吞吐量</b>

    TMS320DM36x SoC架构和吞吐量

    电子发烧友网站提供《TMS320DM36x SoC架构和吞吐量.pdf》资料免费下载
    发表于 10-14 10:51 0次下载
    TMS320DM36x SoC架构和<b class='flag-5'>吞吐量</b>

    TMS320C6472/TMS320TCI6486的吞吐量应用程序报告

    电子发烧友网站提供《TMS320C6472/TMS320TCI6486的吞吐量应用程序报告.pdf》资料免费下载
    发表于 10-14 09:27 0次下载
    TMS320C6472/TMS320TCI6486的<b class='flag-5'>吞吐量</b>应用程序报告

    求助,关于使用iperf测量mesh节点吞吐量问题求解

    我把esp-mesh-lite的no-route例程和iperf例程合在一起,想测试两个mesh节点间tcp通信的吞吐量,实际过程中一开始流量正常,数秒后客户端发数据这边monitor卡死没有任何
    发表于 07-23 06:59

    用Iperf例程测试ESP32-C6的TCP通信,吞吐量很低的原因?

    为什么我用官网的Iperf例程测试ESP32-C6的TCP通信,吞吐量才0.33Mbps
    发表于 06-06 07:47

    有几种电平转换电路,适用于不同的场景

    一.起因一般在消费电路的元器件之间,不同的器件IO的电压是不同的,常规的有5V,3.3V,1.8V等。当器件的IO电压一样的时候,比如都是5V,都是3.3V,那么其之间可以直接通讯,比如拉中断,I2Cdata/clk脚双方直接通讯等。当器件的IO电压不一样的时候,就需要进行电平转换,不然无法实现高低电平的变化。二.电平转换电路常见的有几种电平转换电路,适用于

    张飞实战电子官方
    23小时前
    233

    瑞萨RA8系列教程 | 基于 RASC 生成 Keil 工程

    对于不习惯用 e2 studio 进行开发的同学,可以借助 RASC 生成 Keil 工程,然后在 Keil 环境下愉快的完成开发任务。

    RA生态工作室
    05-01 10:00
    433

    共赴之约 | 第二十七届中国北京国际科技产业博览会圆满落幕

    作为第二十七届北京科博会的参展方,芯佰微有幸与800余家全球科技同仁共赴「科技引领创享未来」之约!文章来源:北京贸促5月11日下午,第二十七届中国北京国际科技产业博览会圆满落幕。本届北京科博会主题为“科技引领创享未来”,由北京市人民政府主办,北京市贸促会,北京市科委、中关村管委会,北京市经济和信息化局,北京市知识产权局和北辰集团共同承办。5万平方米的展览云集

    芯佰微电子
    1天前
    483

    道生物联与巍泰技术联合发布 RTK 无线定位系统:TurMass™ 技术与厘米级高精度定位的深度融合

    道生物联与巍泰技术联合推出全新一代 RTK 无线定位系统——WTS-100(V3.0 RTK)。该系统以巍泰技术自主研发的 RTK(实时动态载波相位差分)高精度定位技术为核心,深度融合道生物联国产新兴窄带高并发 TurMass™ 无线通信技术,为室外大规模定位场景提供厘米级高精度、广覆盖、高并发、低功耗、低成本的一站式解决方案,助力行业智能化升级。

    道生物联
    1天前
    408

    智能家居中的清凉“智”选,310V无刷吊扇驱动方案--其利天下

    炎炎夏日,如何营造出清凉、舒适且节能的室内环境成为了大众关注的焦点。吊扇作为一种经典的家用电器,以其大风量、长寿命、低能耗等优势,依然是众多家庭的首选。而随着智能控制技术与无刷电机技术的不断进步,吊扇正朝着智能化、高效化、低噪化的方向发展。那么接下来小编将结合目前市面上的指标,详细为大家讲解其利天下有限公司推出的无刷吊扇驱动方案。▲其利天下无刷吊扇驱动方案一

    其利天下技术
    05-10 16:29
    914

    电源入口处防反接电路-汽车电子硬件电路设计

    一、为什么要设计防反接电路电源入口处接线及线束制作一般人为操作,有正极和负极接反的可能性,可能会损坏电源和负载电路;汽车电子产品电性能测试标准ISO16750-2的4.7节包含了电压极性反接测试,汽车电子产品须通过该项测试。二、防反接电路设计1.基础版:二极管串联二极管是最简单的防反接电路,因为电源有电源路径(即正极)和返回路径(即负极,GND),那么用二极

    张飞实战电子官方
    05-09 19:34
    860

    半导体芯片需要做哪些测试

    首先我们需要了解芯片制造环节做⼀款芯片最基本的环节是设计->流片->封装->测试,芯片成本构成⼀般为人力成本20%,流片40%,封装35%,测试5%(对于先进工艺,流片成本可能超过60%)。测试其实是芯片各个环节中最“便宜”的一步,在这个每家公司都喊着“CostDown”的激烈市场中,人力成本逐年攀升,晶圆厂和封装厂都在乙方市场中“叱咤风云”,唯独只有测试显

    汉通达
    05-09 10:02
    805

    解决方案 | 芯佰微赋能示波器:高速ADC、USB控制器和RS232芯片——高性能示波器的秘密武器!

    示波器解决方案总述:示波器是电子技术领域中不可或缺的精密测量仪器,通过直观的波形显示,将电信号随时间的变化转化为可视化图形,使复杂的电子现象变得清晰易懂。无论是在科研探索、工业检测还是通信领域,示波器都发挥着不可替代的作用,帮助工程师和技术人员深入剖析电信号的细节,精准定位问题所在,为创新与发展提供坚实的技术支撑。一、技术瓶颈亟待突破性能指标受限:受模拟前端

    芯佰微电子
    05-09 10:36
    1.5k

    硬件设计基础----运算放大器

    1什么是运算放大器运算放大器(运放)用于调节和放大模拟信号,运放是一个内含多级放大电路的集成器件,如图所示:左图为同相位,Vn端接地或稳定的电平,Vp端电平上升,则输出端Vo电平上升,Vp端电平下降,则输出端Vo电平下降;右图为反相位,Vp端接地或稳定的电平,Vn端电平上升,则输出端Vo电平下降,Vn端电平下降,则输出端Vo电平上升2运算放大器的性质理想运算

    张飞实战电子官方
    05-08 19:34
    610

    ElfBoard技术贴|如何调整eMMC存储分区

    ELF 2开发板基于瑞芯微RK3588高性能处理器设计,拥有四核ARM Cortex-A76与四核ARM Cortex-A55的CPU架构,主频高达2.4GHz,内置6TOPS算力的NPU,这一设计让它能够轻松驾驭多种深度学习框架,高效处理各类复杂的AI任务。

    ElfBoard
    05-08 15:01
    1.1k

    米尔基于MYD-YG2LX系统启动时间优化应用笔记

    1.概述MYD-YG2LX采用瑞萨RZ/G2L作为核心处理器,该处理器搭载双核Cortex-A55@1.2GHz+Cortex-M33@200MHz处理器,其内部集成高性能3D加速引擎Mail-G31GPU(500MHz)和视频处理单元(支持H.264硬件编解码),16位的DDR4-1600/DDR3L-1333内存控制器、千兆以太网控制器、USB、CAN、

    米尔电子
    05-08 08:07
    401

    运放技术——基本电路分析

    虚短和虚断的概念由于运放的电压放大倍数很大,一般通用型运算放大器的开环电压放大倍数都在80dB以上。而运放的输出电压是有限的,一般在10V~14V。因此运放的差模输入电压不足1mV,两输入端近似等电位,相当于“短路”。开环电压放大倍数越大,两输入端的电位越接近相等。“虚短”是指在分析运算放大器处于线性状态时,可把两输入端视为等电位,这一特性称为虚假短路,简称

    张飞实战电子官方
    05-07 19:32
    549

    飞凌嵌入式携手中移物联,谱写全国产化方案新生态

    4月22日,飞凌嵌入式“2025嵌入式及边缘AI技术论坛”在深圳成功举办。中移物联网有限公司(以下简称“中移物联”)携OneOS操作系统与飞凌嵌入式共同推出的工业级核心板亮相会议展区,操作系统产品部高级专家严镭受邀作《OneOS工业操作系统——助力国产化智能制造》主题演讲。

    飞凌嵌入式
    05-07 11:26
    1.7k

    ATA-2022B高压放大器在螺栓松动检测中的应用

    实验名称:ATA-2022B高压放大器在螺栓松动检测中的应用实验方向:超声检测实验设备:ATA-2022B高压放大器、函数信号发生器,压电陶瓷片,数据采集卡,示波器,PC等实验内容:本研究基于振动声调制的螺栓松动检测方法,其中低频泵浦波采用单频信号,而高频探测波采用扫频信号,利用泵浦波和探测波在接触面的振动声调制响应对螺栓的松动程度进行检测。通过螺栓松动检测

    Aigtek安泰电子
    05-06 18:44
    1.1k

    MOS管驱动电路——电机干扰与防护处理

    此电路分主电路(完成功能)和保护功能电路。MOS管驱动相关知识:1、跟双极性晶体管相比,一般认为使MOS管导通不需要电流,只要GS电压(Vbe类似)高于一定的值,就可以了。MOS管和晶体管向比较c,b,e—–>d(漏),g(栅),s(源)。2、NMOS的特性,Vgs大于一定的值就会导通,适合用于源极接地时的情况(低端驱动),只要栅极电压达到4V或10V就可以

    张飞实战电子官方
    05-06 19:34
    586