0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

S7t-VG6 VectorPath加速卡的特性和功能

Achronix 来源:Achronix 2024-11-14 11:19 次阅读

S7t-VG6 VectorPath加速卡是Achronix公司联合BittWare公司(Molex旗下的领先企业级FPGA加速器产品供应商)推出的一类全新的、面向高性能计算和数据加速应用的FPGA加速卡。该加速卡搭载了Achronix采用7纳米工艺打造的Speedster 7tAC7t1500独立FPGA芯片,在同类PCIe FPGA加速卡中,可提供目前业界最高性能的接口。这些高性能接口包括1个400G以太网接口和2个100G以太网接口,以及总带宽为3.5 Tbps的8组GDDR6板上存储器,从而使该加速卡成为人工智能/机器学习(AI / ML)、网络和高带宽数据加速应用的理想选择。 本文详细介绍了S7t-VG6 VectorPath加速卡的特性和功能,欢迎您阅读,以进一步了解该产品。您也可以在Achronix微信公众号的“产品介绍”栏目中随时阅读本文。

VectorPath加速卡——基于最新的7纳米FPGA技术构建您的应用

S7t-VG6 FPGA加速卡简介

提升FPGA的加速性能不仅仅在于增加门数,还需要更好的高速数据传输通道、更加精心定制的可编程单元、具有更高带宽的大容量存储以及新一代网络功能的支持。Achronix和BittWare联合打造的S7t VectorPath加速卡,可以为您的应用在计算和数据传输方面提供下一代加速功能。

S7t FPGA加速卡的核心是Achronix的7纳米Speedster7t FPGA。该 FPGA充分发挥了台积电(TSMC)7纳米FinFET工艺的潜力,专门针对人工智能/机器学习和高带宽数据加速应用进行了高度优化。

S7t FPGA加速卡为用户提供了一系列先进的输入输出(I/O)接口,包括400G以太网接口、多个PCIe接口和高带宽GDDR6存储器接口。

客户可以通过BittWare的BittWorks II工具包快速开启此加速卡的使用,该工具包包含示例工程,同时支持Linux和Windows操作系统

(a)Achronix的7纳米Speedster7t FPGA

(b)S7t FPGA加速卡

Achronix的革命性芯片设计+BittWare的企业级设计

S7t-VG6 FPGA加速卡功能

★ 片上网络(NoC)——高速数据通道令FPGA内部畅通无阻

NoC是Speedster7t FPGA的高速数据通道,可以沿着行/列在FPGA结构中或向着边缘接口高速移动数据,从而释放更多的逻辑单元用于计算任务。

NoC的总带宽达 >27 Tbps。外围的NoC(外圈)可以将存储器和PCIe边缘接口连接至NoC的行/列。外围的NoC还可以在独立于FPGA结构之外的接口间移动数据——例如,主机可以在不使用任何FPGA内部资源的情况下通过PCIe将数据传输至GDDR6。

★ FPGA结构——运算能力高达86 TOPS,最高运行频率为750MHz

可重新配置的逻辑模块(RLB)

RLB是Speedster7t的一项特色功能:它是一种全新的可重新配置的逻辑架构,带有6输入查找表和8位算术逻辑单元,每个查找表有2个触发器,它还具有一种基于改进型Booth算法重新构造的乘法器查找表(MLUT)模式,该算法可使基于查找表的乘法运算性能提高一倍。

Speedster7t FPGA拥有692K的查找表。

机器学习处理器(MLP)

MLP模块是支持定点和浮点计算的大规模矩阵向量和矩阵乘法引擎。MLP提供的功能包括带有累加可选项的整数乘法(int4/int8/int16/int32)、bfloat16格式的浮点运算、16位浮点运算、块浮点运算和24位浮点运算。MLP完全可拆分的整数乘法器/累加器的结构,可有效支持机器学习推理和更传统的应用,例如复杂的自适应信号处理。

根据不同乘法器格式,每个MLP可以支持或是可等效成的乘法器数量也会有变化,例如每个MLP可以支持4个int16,或者16个int8,或者32个int4乘法器。Achronix的Speedster7t-1500器件支持有2560个MLP,因此支持Int8 MAC多达40,960个,运行在750MHz的时钟频率时,推算最大性能为每秒61.4万亿次操作。

MLP模块包括两个可以单独使用或与乘法器一起使用的存储器模块。总体的嵌入式存储器容量为189Mb。

★ 高带宽GDDR6存储器

速度快6倍的大容量存储器——目前板卡支持的GDDR6带宽为3.5Tbps,容量为16GB容量。而FPGA芯片支持的GDDR6带宽可到4Tbps,容量可支持到32GB。

通过使用高带宽GDDR6存储器,S7t加速卡可以为您的应用提供16GB的大容量存储器资源,但同时可提供高达6倍的带宽。

此外,借助NoC,可以在不使用FPGA资源的情况下,从主机通过PCIe对GDDR6进行读/写。

★ 高达400G的网络

S7t加速卡提供了一系列可连接至Speedster7t FPGA逻辑结构的网络接口。凭借由硬IP实现的MAC(Hard IP MAC)和前向纠错(FEC)技术的支持,该加速卡可支持56G PAM4。板载的抖动消除器可用于同步以太网(Synchronous Ethernet)。

QSFP 56G(PAM4)接口

第一个接口是一个带有4个SerDes通道的QSFP56接口,可支持的以太网接口:200/100/50/25/10 GbE。

第二个接口是一个带有8个SerDes通道的QSFP-DD接口,可支持的以太网接口:400/200/100/50/25/10 GbE。

如图所示的分支连接线提供了一系列其他选项。

★ PCIe、扩展和定制

PCIe Gen5 x16接口

S7t加速卡支持一个PCIe Gen5 x16接口,已经通过PCI-SIG认证。BittWorks II工具包提供的示例项目中包括了用于PCIe交互的示例。

MCIO接口

支持MCIO接口,通过4个高速收发器连接到FPGA,支持PCIe Gen5的数据速率。

支持PCIe5.0的NVMe存储应用

板对板互连

可以使用自定义选项连接至配件板

定制

得益于三十年来构建定制化解决方案的经验,BittWare作为您的合作伙伴可以在各方面提供支持,从简单的配件板到各种具有复杂机械要求的完全定制方案,一应俱全。我们的资源包括业务覆盖全球的莫仕(Molex)集团,因此可以处理任何规模的项目。

★ 加速卡的其他功能

用于同步以太网的抖动消除器

可从前面板接入1 pps(每秒1个脉冲)的外部参考时钟

具有健康监测功能的基板管理控制器(BMC)

用于Linux和Windows操作系统的驱动程序

应用领域

★ 计算

旨在满足要求最严苛的计算密集型应用

8组GDDR6存储器可提供3.5 Tbps左右的带宽

针对人工智能/机器学习(AI/ML)功能进行了优化的机器学习处理器(MLP):

在Int8整数格式下,可提供多达41K的乘累加单元(MAC)

支持多种浮点格式和整数格式

★ 网络

QSFP-DD和QSFP56端口可满足多种高速网络应用的需求

硬化的多速率MAC适用于10G - 400G以太网

片上网络(NoC)的带宽超过27 Tbps,支持数据流输入器件、从器件输出以及跨越整个器件移动。

★ 存储

NVMe接入可支持数据记录器和数据处理应用

通过MICO扩展端口连接NVMe闪存

数据流直接从网络端口传输至闪存阵列

传感器处理

使用GPIO和SerDes扩展端口针对您的特定应用需求进行优化

直接与自定义数据和控制信号连接

可直接互补性传感器和处理器技术

开发工具

★ ACE:FPGA开发软件

Achronix的ACE软件是Speedster7t的开发环境。ACE可以执行硬件设计流程,支持RTL输入(VHDL和Verilog语言皆可)和行业标准仿真。ACE还支持使用NoC等高级芯片功能。ACE包括了为Achronix优化的Synopsys的Synplify-Pro工具。

★ BittWare的BittWorks II工具包:强大的开发工具

BittWorks II工具包提供了驱动程序、库、实用程序和示例项目,可用于访问、整合和开发S7t加速卡的应用。

TeraBox服务器

★ 将您的S7t加速卡置入TeraBox服务器中!

让我们来完成服务器的集成并启动您的应用的概念验证,您无需再去准备额外的、宝贵的开发资源!

★ 通过TeraBox服务器延长您的保修期

对于大多数内置加速卡的TeraBox服务器,您在购买后可以将加速卡的保修期延长至3年。

S7t-VG6加速卡的规格

FPGA Speedster AC7t1500
基于 TSMC 7nm FinFET 工艺
692K的6输入LUT(相当于1,522K的4输入LUT)
二维NOC达到 >27 Tbps的带宽
片上RAM的容量约为189Mb
高达86 TOPS 的 int8 性能
ResNet-50 基准测试:每秒 8,600 张图像
该芯片支持GDDR6的总带宽可到4Tbps,容量可到32GB
该芯片支持112Gbps SerDes
板载存储器 GDDR6
板载的8组GDDR6存储器,总带宽约为3.5Tbps,总存储容量为16GB
DDR4
具有错误检查和纠正(ECC)功能的、运行频率为2666MHz的DDR4存储器,存储容量为4GB(72位位宽)
Flash
用于启动FPGA的闪存
主机接口 可直接连接至FPGA的PCIe Gen5/4 x16接口
外部时钟 可从前面板输入1pps、10MHz的参考时钟
Micro USB接口 通过USB接口访问BMC,USB接口转JTAG接口,USB接口转UART接口
MCIO接口 MCIO接口位于加速卡正面,通过4个收发器连接至FPGA
由硬PCIe IP实现
GPIO接口 8个GPIO引脚,电压为3.3V,单端型,每个GPIO引脚的方向(发送或接收)可由FPGA分别设置,缓冲器的额定速率为200Mbps
QSFP接口 板上的QSFP-DD的接口:
56G PAM4收发器
支持:1x 400GbE,2x 200GbE,4x 100GbE或8x 10/25/40/50GbE
支持MAC硬核和前向纠错(FEC)功能
板上的QSFP56接口:
56G PAM4收发器
支持:1x 200GbE,2x 100GbE,或4x 10/25/40/50GbE
支持MAC硬核和前向纠错(FEC)功能
基板管理控制器 电压、电流、温度监测
上电顺序和复位
现场升级
FPGA配置和控制
时钟配置
I2C总线访问
USB 2.0接口
电压调节
冷却 标准:双倍宽度无源散热器
可选项:双倍宽度有源散热器
可选项:双倍宽度液体冷却
用电 板上供电来自于两个AUX连接器(8引脚)
功耗取决于应用
典型的最大功耗值有待确定
环境 工作温度为5°C-35°C
尺寸 标准高度、双倍宽度的PCIe板

关于Achronix半导体公司

Achronix半导体公司是一家私有的、采用无晶圆厂模式的半导体公司,总部位于美国加利福尼亚州圣克拉拉市,同时提供高性能FPGA和嵌入式FPGA(eFPGA)解决方案。Achronix历来都是高性能FPGA市场向前发展的推动者之一。Achronix提供的产品包括可编程的FPGA结构,具有硬连线系统级模块的高性能、高密度独立FPGA,数据中心和高性能计算(HPC)硬件加速器板,以及支持所有Achronix产品的一流EDA软件。公司在美国、欧洲和中国都设有销售办公室和代表处,在印度班加罗尔设有一间研发和设计办公室。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    40

    文章

    5394

    浏览量

    171285
  • 接口
    +关注

    关注

    33

    文章

    8537

    浏览量

    150906
  • 加速卡
    +关注

    关注

    1

    文章

    60

    浏览量

    10939
  • Achronix
    +关注

    关注

    1

    文章

    76

    浏览量

    22523

原文标题:S7t-VG6 VectorPath加速卡产品介绍

文章出处:【微信号:Achronix,微信公众号:Achronix】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于Xilinx XCKU115的半高PCIe x8 硬件加速卡解决方案

    基于Xilinx XCKU115的半高PCIe x8 硬件加速卡一、概述本板卡系我公司自主研发,采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作为主处理器,主要用于FPGA
    发表于 07-27 16:49

    基于Xilinx XCKU115的半高PCIe x8硬件加速卡

    基于Xilinx XCKU115的半高PCIe x8 硬件加速卡北京太速科技有限公司一、概述 本板卡系我公司自主研发,采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作为主处理器
    发表于 08-22 17:31

    基于加速卡的FPGA生态系统布局是怎样的?

    FPGA加速卡是如何产生的?主要的FPGA加速卡产品有哪些?基于加速卡的FPGA生态系统布局是怎样的?
    发表于 06-17 06:07

    求一种基于Xilinx XCKU115的半高PCIe x8 硬件加速卡

    半高PCIe x8硬件加速卡有哪些技术指标?半高PCIe x8硬件加速卡的物理特性是什么?半高PCIe x8硬件加速卡的接口测试软件有哪些?
    发表于 06-25 07:16

    MLU220-M.2边缘端智能加速卡支持相关资料介绍

    对模型转化、量化、开发、精度调优等需要在配合MLU270在x86 PC上完成,然后生成离线模型,部署到MLU220加速卡上。核心特性寒武纪MLUv02架构多达16个张量核心,借助NOC片上网络提升并行
    发表于 08-08 17:37

    LCD转VGA/AV/S-Video视频加速卡

    LCD转VGA/AV/S-Video视频加速卡:此 LCD 转VGA 视频加速卡是一款以FPGA+SDRAM+DAC 为核心的视频加速卡。带有LCD 控制器的CPU 通过此视频
    发表于 09-21 08:25 73次下载

    LCD转VGA视频加速卡

    LCD转VGA视频加速卡:此 LCD 转VGA 视频加速卡是一款以FPGA+SDRAM+DAC 为核心的视频加速卡。带有LCD 控制器的CPU 通过此视频加速卡,可以驱动带VGA 接口
    发表于 09-21 08:28 56次下载

    Achronix联合Molex推出VectorPath S7T-VG6加速卡

    基于Speedster7t FPGA芯片的新型VectorPath PCIe加速卡为高带宽数据加速应用提供了全新的性能
    的头像 发表于 10-31 16:40 3600次阅读

    Achronix与BittWare共同研发FPGA芯片VectorPath加速卡

    Achronix半导体公司与Mo-lex旗下FPGA加速器产品供应商BittWare联合推出全新的、面向高性能计算和数据加速应用的FPGA加速卡,可实现云计算与边缘计算加速,助力高带宽
    发表于 11-08 15:07 668次阅读

    数据中心加速器也许会是FPGA最高的细分市场

    全球发布创新的、基于Speedster7t FPGA系列的VectorPath S7t-VG6加速卡产品。
    发表于 11-08 15:11 1157次阅读

    BittWare和Achronix合作推出采用7纳米的Speedster7t FPGA

    ,即将推出 S7t-VG6 PCIe 加速卡产品──这是一种功能丰富的 PCIe ,支持全新的 Achronix® 7 纳米 Speeds
    发表于 11-19 15:03 739次阅读

    Achronix联合BittWare推出了VectorPath S7t-VG6 PCIe加速卡

    更加关键的是Speedster7t器件具有满足未来人工智能和机器学习要求的超高带宽接口,包括400G以太网端口、用于数据传输的PCI Express Gen5端口以及支持低成本、高带宽存储的GDDR6控制器。
    的头像 发表于 11-27 15:16 7278次阅读

    AMD刚刚发布7nm CDNA架构的MI100加速卡

    今晚AMD刚刚发布了7nm CDNA架构的MI100加速卡,NVIDIA这边就推出了A100 80GB加速卡。虽然AMD把性能夺回去了,但是A100 80GB的HBM2e显存也是史无前例了。
    的头像 发表于 11-17 10:23 2399次阅读
    AMD刚刚发布<b class='flag-5'>7</b>nm CDNA架构的MI100<b class='flag-5'>加速卡</b>

    FPGA PCIe加速卡开源硬件及例程介绍

    基于Xilinx Artix-7系列FPGA芯片设计的M.2 M-Key FPGA加速卡,引出Artix7-484脚芯片的4条高速GT,最高支持PCIE2.0*4速率。
    的头像 发表于 03-24 09:13 4357次阅读

    采用CEM插卡模式的VectorPath®加速卡在业内率先通过PCIe Gen5 x16 32 GT/s认证

    “Achronix一直在推动高性能FPGA加速卡市场的发展,”BittWare副总裁Craig Petrie说道。“获得PCI-SIG Gen5认证是一个重要的里程碑。我们的客户可以放心和相信我们的加速卡可以达到最高的PCIe带宽,以及
    的头像 发表于 06-02 16:10 824次阅读
    采用CEM插卡模式的<b class='flag-5'>VectorPath</b>®<b class='flag-5'>加速卡</b>在业内率先通过PCIe Gen5 x16 32 GT/<b class='flag-5'>s</b>认证