过去几年,FPGA的CAGR大约一直保持在8-10%左右,随着该类器件在AI应用中的扩张,未来5年其CAGR增长将高达38.4%!根据市场调研公司Semico Research的预测,人工智能应用中FPGA的市场规模将在未来4年内增长3倍,达到52亿美元。为了保持竞争力,目前全球有25%的企业实施了人工智能/机器学习(AI/ML),而两年内,这一比例将增长到72%,以更好地获得核心职能方面的商业洞察力。
图:企业AI/ML部署需求增长趋势
伴随这一趋势,AI的算法在不断演进,对数值精度的选择要求也更加多元,高效算力、高效丰富的存储缓存能力以及高效大带宽的数据运送能力,是AI/ML硬件解决方案所面临的主要挑战。系统开发者会利用FPGA架构去优化功耗、性能和灵活性,并突破处理单元在效率上的瓶颈,包括计算引擎、内存层次结构和数据移动。
图:算法和精度要求不同给处理带来挑战
就AI的应用而言,不同场景应用对FPGA的需求不同。通常云计算中的应用主要是需要FPGA在AI/ML和高带宽数据加速上的能力,而在端侧则需要在高灵活性的同时还要具有ASIC的性能。虽然,FPGA已经大量应用于泛AI领域,但它是否很好的满足这两个方面的需求,还是一个值得探讨的话题。
重构FPGA架构
纵观FPGA产品的演进历史(包括器件的产生),每一次大的迭代都是一种设计方法论的革新,从这个角度看,Achronix公司最近发布的Speedster7t针对上述两个应用场景上进行的优化都可以看做方法论上的革新。在开发Speedster7t的过程中,Achronix的工程团队完全重新构想了整个FPGA架构,以平衡片上处理、互连和外部输入输出接口,实现数据密集型应用吞吐量的最大化,这些应用场景可见于那些基于边缘和基于服务器的AI/ML应用、网络处理和存储。
“Speedster7t是我们历史上最令人激动的发布,代表了建立在四个架构代系的硬件和软件开发基础上的创新和积淀。”Achronix公司董事长兼首席执行官Robert Blake介绍,“该器件采用TSMC的7nm FinFET工艺制造,专为ML和高带宽网络应用进行了优化。”
具体而言,相较于目前的FPGA,Speedster7t革新之处在于设计了针对ML的处理器(MLP),以及一个可横跨和垂直跨越FPGA逻辑阵列的高带宽的二维片上网络(NOC),二者结合既保留了FPGA的灵活性,又实现了ASIC的性能。
不占用FPGA布线的MLP单元
这个片内的MLP是高度可配置的、计算密集型的单元模块,可支持4到24位的整点格式和高效的浮点模式,包括对TensorFlow的16位格式的支持,以及可使每个MLP的计算引擎加倍的增压块浮点格式的直接支持。该MLP可以通过运算和缓存级链实现更复杂的算法,而不需要使用FPGA布线资源。
“目前FPGA会使用DSP来进行ML的处理,但其对数值精度的支持并不高效,并且需要消耗额外逻辑和存储资源,其性能也受限于FPGA布线。”Blake说,“DSP常用于无线数字滤波的处理,而Speedster7t中的MLP则在计算架构、缓存(内嵌)、可配置算法以及对整点和浮点的支持上提供了更好的AI/ML的计算性能和能效比。”
图:在FPGA中采用MLP(右)比DSP(左)更适用于AI/ML处理
二维片上网络——NOC
NOC是在FPGA路由结构上的另一个重要革新。这一设计主要针对FPGA的片上处理引擎之间所需的高带宽通信。Speedster7t片上资源包括8个GDDR6控制器、72个业界SerDes(1到112 Gbps)、带有前向纠错(FEC)的硬件400G以太网MAC(4x100G或8x50G的配置),以及硬件PCI Express Gen5控制器(每个控制器有8个或16个通道)。
这些高速I/O和存储器端口的数万兆比特数据很容易淹没传统FPGA面向比特位的可编程互连逻辑阵列的路由容量,而Speedster7t通过NOC把它们连接到所有FPGA的高速数据和存储器接口。NOC和FPGA功能之间通过网络接入点NAP连接,每个水平行和垂直列的交叉点都有NAP(主NAP和从NAP)。NoC中的每行/列都可同时为每个方向提供512Gbps的数据流量,其链路双向运行,最大的设备带宽可以达到20Tbps。
“最重要的是,NOC消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。”Blake说,“这种高性能网络不仅可以提高Speedster7t FPGA的总带宽容量,还可以在降低功耗的同时提高有效LUT容量。”
图:NOC是在FPGA路由结构上的另一个重要革新
的确,NOC这一方法解决了GDDR6、400G以太网MAC这些片上资源海量数据传输的问题。Speedster7t是目前市面唯一支持GDDR6存储器的FPGA,可以支持4 Tbps的GDDR6累加带宽,可以很小的成本提供与基于HBM的FPGA等效存储带宽。相较于HBM,GDDR6只需要一半的成本就可以满足高存储层次和带宽的需求,并且,HBM是固化的块,GDDR6则更灵活,用户可以选择不同容量和带宽。
NOC也解决了传统FPGA的运行速度无法满足任何400G以太网总线宽度要求的问题,400G以太网的总线大小达1024bit,所需的最高频率达到724 MHz,这在传统FPGA中无法实现,NOC由于消除了传统设计中与FPGA布线相关的延迟,所以可以最高支持750 MHz的频率,这满足了MLP和嵌入式存储器模、400G以太网MAC及高速SerDes之间的数据传输。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
FPGA
+关注
关注
1626文章
21679浏览量
602129 -
NoC
+关注
关注
0文章
38浏览量
11723
发布评论请先 登录
相关推荐
集成电路与人工智能结合
集成电路,为人工智能算法提供了强大的算力支持。 随着人工智能技术的不断发展,对存储和计算能力的需求日益增长,而集成电路的快速发展正好满足了
嵌入式和人工智能究竟是什么关系?
嵌入式和人工智能究竟是什么关系?
嵌入式系统是一种特殊的系统,它通常被嵌入到其他设备或机器中,以实现特定功能。嵌入式系统具有非常强的适应性和灵活性,能够根据用户需求进行定制化设计。它广泛应用于各种
发表于 11-14 16:39
FPGA应用于人工智能的趋势
FPGA(现场可编程门阵列)在人工智能领域的应用趋势日益显著,主要归因于其高速、低功耗、灵活性和并行处理能力等独特优势。以下是对FPGA应用于人工智能趋势的分析:
Adobe发布人工智能视频创作工具:Firefly Video Model
Adobe公司于10月15日正式揭晓了其最新研发的人工智能视频创作工具——Firefly Video Model。这一创新解决方案旨在借助AI技术,赋能视频内容创作者拓宽创意边界,提升
《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感
驱动科学创新》的第6章为我提供了宝贵的知识和见解,让我对人工智能在能源科学中的应用有了更深入的认识。通过阅读这一章,我更加坚信人工智能在未来
发表于 10-14 09:27
AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感
阅读这一章后,我深感人工智能与生命科学的结合正引领着一场前所未有的科学革命,以下是我个人的读后感:
1. 技术革新与生命科学进步
这一章详细
发表于 10-14 09:21
《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得
,还促进了新理论、新技术的诞生。
3. 挑战与机遇并存
尽管人工智能为科学创新带来了巨大潜力,但第一章也诚实地讨论了伴随而来的挑战。数据隐私、算法偏见、伦理道德等问题不容忽视。如何在利
发表于 10-14 09:12
risc-v在人工智能图像处理应用前景分析
满足人工智能图像处理中对于高性能、低功耗和特定功能的需求。
低功耗 :
在人工智能图像处理中,低功耗是一个重要的考量因素。RISC-V架构的设计使其在处理任务时能够保持较低的功耗水平
发表于 09-28 11:00
名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新
芯片设计的自动化水平、优化半导体制造和封测的工艺和水平、寻找新一代半导体材料等方面提供帮助。
第6章介绍了人工智能在化石能源科学研究、可再生能源科学研究、能源转型三个方面的落地应用。
第7章从环境监测
发表于 09-09 13:54
FPGA在人工智能中的应用有哪些?
FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面:
一、深度学习加速
训练和推理过程加速:FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和
发表于 07-29 17:05
西部数据发布AI数据周期框架,推动人工智能革新
在人工智能领域持续革新的今天,西部数据公司凭借其深厚的技术积累,正式发布了全新的人工智能数据周期(AI Data Cycle)框架。这一框架
fpga芯片和人工智能芯片的区别
FPGA芯片和人工智能芯片(AI芯片)在设计和应用上存在一些关键的区别,这些区别主要体现在它们的功能、优化目标和适用场景上。
嵌入式人工智能的就业方向有哪些?
嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能
发表于 02-26 10:17
卡诺模型驱动人工智能革新:重塑未来智能生态!
效地满足用户需求,推动产业智能化升级。 卡诺模型,即Kano模型,它通过对顾客需求的分类和分析,帮助企业明确产品开发的优先级和方向。将这一模型应用于
评论