电子发烧友网报道(文/黄晶晶)面对金融行业处理大量数据、即时交易的需求,AMD提供CPU到FPGA的全套解决方案支持快速地交易执行。其中,在资本市场,HFT(高频交易)对低时延格外看重,低时延是降低成本和获得利润的关键所在。
近日,AMD推出Alveo UL3422 加速卡,它是由 AMD Virtex UltraScale+ FPGA 提供支持,其采用新颖的收发器架构,具备硬化且经过优化的网络连接核,专为高速交易定制打造。它可实现超低时延交易执行,达到低于3纳秒的 FPGA 收发器时延和突破性的“tick-to-trade”性能,这是标准现成 FPGA 无法实现的。AMD Alveo UL3422为交易商、做市商和金融机构提供了一款针对机架空间和成本进行优化的纤薄型加速卡,旨在快速部署到各种服务器中。
近日,AMD推出Alveo UL3422 加速卡,它是由 AMD Virtex UltraScale+ FPGA 提供支持,其采用新颖的收发器架构,具备硬化且经过优化的网络连接核,专为高速交易定制打造。它可实现超低时延交易执行,达到低于3纳秒的 FPGA 收发器时延和突破性的“tick-to-trade”性能,这是标准现成 FPGA 无法实现的。AMD Alveo UL3422为交易商、做市商和金融机构提供了一款针对机架空间和成本进行优化的纤薄型加速卡,旨在快速部署到各种服务器中。
高频交易的需求点
高频交易是使用算法非常迅速地实现tick-to-trade交易。它使用非常复杂的算法,以及要求非常高的硬件。通常是利用市场上非常小的价差以及市场的低效,在短时高频发生的交易来获得利润。
因此,高频交易主要有三大特点,一是要求低时延,只差几微秒可能就是盈利几百万美元到亏损之间的差别。二是基础设施也非常关键,要进行高频交易经常需要在交易所租用服务器,实现交易所的服务器共置,通过这样的方式来获得优势。有很多的高频交易公司都是在交易所非常接近的地方或者就是在交易所来部署基础设施。在机架上服务器的数量,对于高频交易来说也非常重要。三是算法也能够给高频交易带来优势,自适应计算还能够帮助高频交易的交易商来实现监管合规,这对于他们的效率也非常重要。
Alveo UL3422具有超低时延,且更具性价比
Alveo UL3422是AMD Alveo超低时延加速卡产品组合的一个最新成员,相比于一年前推出的Alveo UL3524,Alveo UL3422的设计更具有性价比,又能够保持Alveo UL3524的诸多优势。
Alveo UL3422具有精简功能集,与Alveo UL3524卡相比,它有优化的连接,以及板载内存。Alveo UL3422 加速卡减少了端口密度、板载内存和连接选项,但依然采用相同的 AMD Virtex UltraScale+ VU2P FPGA 来实现超低时延。
Alveo UL3422 加速卡具备787K LUT(可编程逻辑),支持PCIe 4.0 x8系统总线,并板载多达16GB内存。两个QSFP-DD模块提供了10G、25G网络端口;两个ARF6端口可以连接多张卡;PPS时钟同步1个输入接口,1个输出接口,可以和外部单元交互,获得精准时间戳。有非常纤薄的尺寸规格,全高、半长( FHHL )尺寸规格封装,适用于1U服务器,优化机架空间能够显著节省共置服务器的费用,也可以灵活适用于2U和4U服务器配置,可以增加每台服务器卡的数量。
AMD主要通过GTF收发器来实现超低延时的目标。AMD自适应和嵌入式计算事业部的高级产品线经理Shyam Chander解析,GTF和GTY两种收发器的网络协议都是一样的,但GTF收发器比之前的GTY收发器性能提升约7倍,时延从16纳秒降低到仅仅2.34纳秒,主要是实现了最大的硬化。而tick-to-trade这个时延能够降低40%到49%,相当于14纳秒(13.9纳秒),尤其是对于金融行业的交易来说,这是一个巨大的优势。
Shyam Chander进一步表示,GTY的收发器是能够在Virtex UltraScale+ 所有纳米级别的产品上都可以有的,包括16纳米。但是GTF仅仅是在VirtexUltraScale+ VU2P FPGA芯片上,专为超低时延市场开发的一款收发器,无论是Alveo UL3422,还是之前推出的AlveoUL3524都是基于这样的芯片,能够支持超低时延的应用需求。
Alveo UL3422加速卡可以用于支持算法、交易,FPGA和DSP块能够实现加速,能够执行客户的交易策略,它内置的RAM可以实现内存的迅速访问和存储,DDR4可以用于存储订单簿信息和历史定价的数据。
AMD提供不同的加速卡产品组合,应用各种算法交易用例,主要分为三类。第一类是时延低于20纳秒的超低时延FPGA,这类交易对速度要求高,算法要求简洁明了;Alveo UL3422和AlveoUL3524等产品可满足这类需求。第二类是时延低于100纳秒的低时延FPGA,包括FPGA和自适应的SoC,对时间的要求可以放松一些,算法复杂程度有所提高,数据的数量也会更加大,会进行更加深层次的历史模型的分析。Alveo V80可满足需求。
第三类是传统的CPU交易,延时低于1000纳秒,在处理过程中数据主要通过CPU的主机来进行处理和计算,数据传输是通过NIC实现的。Alveo X3522能够支持这些低时延的CPU交易,EPYC、锐龙都能够满足相关的工作负载和用例的需求。
生态合作,加快开发设计
Alveo UL3422 加速卡通过利用可用的基础设施生态系统解决方案和参考设计来实现快速部署,从而为交易开发人员提供快速完成设计并投入市场所需的优势。其由不断壮大的生态系统合作伙伴解决方案网络提供支持,这些解决方案提供 IP 和开发框架,以实现交易解决方案的快速实施。例如Exegy 是一家端到端前台交易解决方案提供商,它能够预构建的基础设施IP可以实现超低时延,运行时堆栈和API也简化了开发。Hypertec 是一家面向金融服务行业的硬件、云和增值解决方案提供商,Xelera Technologies 是一家面向高速网络技术和机器学习( ML )应用的软件提供商, 与 AMD 合作助力应对高频交易中机器学习算法的时延缺陷。
Alveo UL3422 采用 AMD Vivado 设计套件支持传统 FPGA 流程,并附带一套参考设计和性能基准,使 FPGA 设计人员能够快速探索关键指标并根据规范制定定制交易策略。
AMD 为开发人员提供了开源且受到社区支持的FINN开发框架,令低时延 AI 模型能够部署到高性能交易系统中。FINN 项目采用 PyTorch 和神经网络量化技术,旨在缩小 AI 模型尺寸的同时保持准确性。FINN 编译器可生成能与 AMD FPGA 共同使用的量化神经网络( QNN )硬件 IP 块。
小结:
AMD的UL3422正是因为市场上客户既要数据传输快又要尺寸小价格合适,这实际是工作负载和网络节点需求之间的平衡。除了金融科技之外,在科研活动当中,很多数据馈送的处理需要交换机中来完成,如果有一个交换机能够实现超低时延,也是非常重要的要求,AMD同样看到了这样的应用趋势。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
amd
+关注
关注
25文章
5438浏览量
133911 -
加速卡
+关注
关注
1文章
60浏览量
10935
发布评论请先 登录
相关推荐
AMD 以全球极快的纤薄尺寸电子交易加速卡扩展 Alveo 产品组合,助力广泛且具性价比的服务器部署
,纳斯达克股票代码:AMD)今日宣布推出 AMD Alveo™ UL3422 加速卡,这是其创纪录的加速卡系列1的最新成员,专为超低时
发表于 10-16 14:35
•107次阅读
AMD 以全球极快的纤薄尺寸电子交易加速卡扩展 Alveo 产品组合,助力广泛且具性价比的服务器部署
,纳斯达克股票代码:AMD)今日宣布推出 AMD Alveo™ UL3422 加速卡,这是其创纪录的加速卡系列1的最新成员,专为超低时
发表于 10-16 14:16
•133次阅读
AMD推出新款纤薄尺寸电子交易加速卡
AMD(超威,纳斯达克股票代码:AMD)今日宣布推出 AMD Alveo UL3422 加速卡 ,这是其创纪录的加速卡系列1的最新成员,专为
Optiver采用AMD企业级产品实现数据中心现代化
基础设施,帮助其进一步履行改善金融市场的使命。通过 AMD EPYC(霄龙)处理器、AMD Solarflare 低时延以太网适配器、
借助全新 AMD Alveo™ V80 计算加速卡释放计算能力
灵活应变能力以实现工作负载优化。Alveo V80 加速卡现已量产出货,其能提供较之上一代加速卡至高 2 倍的带宽与计算密度1,并为使用 AMD Vivado™ 设计套件的 FPGA
发表于 05-16 14:09
•198次阅读
AMD Alveo V80计算加速卡实现量产
AMD公司近日迎来了一个重要的里程碑,其专为大型数据集和内存受限型应用设计的Alveo V80计算加速卡,已正式进入量产出货阶段。这款创新产品针对高性能计算(HPC)、数据分析、金融、
AMD正式量产Alveo V80计算加速卡,优化大数据集中的内存瓶颈问题
适用场景包括HPC、数据分析、金融、网络安全及计算存储等领域。据AMD官网上显示,计算加速卡建议零售价高达9495美元(当前折合人民币约为68,744元)。
中科驭数超低时延网络解决方案入选2023年度金融信创优秀解决方案
近日,由中国人民银行领导、中国金融电子化集团有限公司牵头组建的金融信创生态实验室发布「2023年度第三期金融信创优秀解决方案」,中科驭数超低
英伟达发布最强AI加速卡Blackwell GB200
英伟达在最近的GTC开发者大会上发布了其最新、最强大的AI加速卡——GB200。这款加速卡采用了新一代AI图形处理器架构Blackwell,标志着英伟达在AI图形处理领域迈入了
今日看点丨英伟达发布最强 AI 加速卡--Blackwell GB200;三星面临罢工 存储市场供需引关注
的 GTC 开发者大会上,正式发布了最强 AI 加速卡 GB200,并计划今年晚些时候发货。 GB200 采用新一代 AI 图形处理器架构 Blackwell,黄仁勋在 GTC 大会上
发表于 03-19 11:08
•1181次阅读
宁畅参与发布AI加速卡液冷设计白皮书
近日,由宁畅参与起草的《基于标准PCIe接口的人工智能加速卡液冷设计》白皮书正式发布。该技术白皮书由开放计算标准工作委员会(OCTC)归口,旨在为冷板式人工智能加速卡的设计提供重要指导。
评论