不同于曾经的竞争对手,作为全球FPGA前双雄之一的Altera,在被Intel收购后,似乎沉默了很久——Intel以数据处理业务为中心的导向,使其FPGA的产品迭代被处理器和加速卡业务的节奏紧密的捆绑在一起。
这涉及到Intel的市场战略。在FPGA行业里面工作了三十多年,Patrick Dorsey见证了5代的FPGA产品的发展,他目前担任英特尔可编程解决方案事业部首席产品营销官,他认为现在正是从电脑为中心逐渐转向以数据为中心的时代,“客户需要深刻的理解数据,因为市场比过去任何时候变化的更快,” Dorsey在接受电子发烧友的采访时说。“我们要了解面对的挑战,并推出合适的产品。”
变化和挑战
“以数据为中心的时代”并非一个概念,结合分析机构和Intel自己的调研,预期到2020年,普通用户每天产生的数据量为1.5GB,智慧医院每天3TB,自动驾驶每天达4TB,而联网飞机和智慧工厂每天分别达到了40TB和1PB!
这个变化的趋势推动了数据处理市场需求的转型并推动了创新,其中一个重要方向是高度定制化的软硬件方案。Dorsey表示,不同用户对数据处理的需求不同,在嵌入式应用领域和边缘设备端,用户需求是能够实时抽取包括图像、视频和视觉信息在内的数据;在通信基础设施端,用户需要高带宽融合处理能力;在云端和相关企业,需求则是能够高效的管理、组织和处理激增的数据。
用FPGA实现加速
与数据处理相关的关键词是:实时、带宽以及高速储存和分析处理。对系统的要求集中在处理和加速性能上——这正符合Intel所致力的产品规划:以Xeon为代表的处理器+以FPGA为核心的加速器。前者在全球数据处理服务器市场已经居于垄断地位,现在是该FPGA发力了,于是,Agilex诞生了。
用Dorsey的话来说,Agilex是一款“全面借助于Intel自己的能力”开发的FPGA,具体而言就是Intel自研的基础架构、Intel的处理技术、Intel的3D封装和Intel的软件。实际上,Agilex的确体现了你能想象到的所有与Intel相关的技术资源。
解读Agilex
把Agilex想象成传统的FPGA或者Stratix 10的升级版是错误的,它完全是一个不同的产品。Agilex采用Intel的10nm工艺制程,在数据处理性能上,它采用了Intel第二代HYPERFLEX架构,相较于上一代Stratix 10性能提升了40%,功耗降低了40%,DSP(FP16)性能高达40 TELOPS。存储上,除了通用的DDR5和HBM,还有英特尔独有的Optane。在数据收发速率上,Agilex的收发器速率达到112Gbps(目前业内最高)!
“需要留意的是BFLOAT16,这是一个新的标准。谷歌的TPU里面已经采用了这个标准,” Dorsey 强调,“Agilex支持硬件化的BFLOAT16和FP16,这使得它更加适用于AI领域。”
能够进行任意异构3D集成是Agilex所强调的一个特点,这使得Agilex可以根据需要任意集成包括以芯片间3D封装互联的嵌入式多芯片互联桥接、包含收发器、自定义I/O和自定义计算芯片在内的芯片库以及eASIC(英特尔去年收购的公司)定制芯片这些资源。
图:Agilex能够进行任意异构3D集成
这有赖于Intel最新推出的名为Foveros的全新逻辑晶圆3D堆叠技术,可实现在逻辑晶圆上堆叠逻辑处理单元。该技术首次将晶圆的堆叠从传统的无源中间互连层和堆叠储存晶片扩展到CPU、GPU和AI处理器等高性能逻辑晶圆。
“我们可以把不同类型的芯片,不同的半导体工艺节点封装到FPGA内部” Dorsey 解释何为任意集成,“这样就可以根据客户或市场的需求,把最合适的功能、Chiplet封装到一起,以快速实现用户交付。”
Intel的eASIC和ASIC提供了大量可重复使用的IP,这构成了其所谓的“自定义逻辑连续体”,使得Agilex的灵活性较FPGA多了一层延展。
有了灵活性和高性能,FPGA在系统中要充分发挥加速性能还需要与处理器之间保持一个高速通畅的连接,Intel的“内存一致性”技术派上了用场——他们不久前推出的内存一致性技术CXL是专为下一代数据中心应用开发的高速“CPU到设备”和“CPU到内存”的开放互连技术,可实现CPU与工作负载加速器(如GPU、FPGA和其他专用加速器)之间的高速、高效互连,该技术运行在PCIe GEN5上。Agilex是首款也是目前唯一一个支持Intel Xeon内存一致性的加速器,
图:Agilex分成三个型号,通用型的F系列,强调高连接性能的I系列和高存储、计算性能的M系列。
Agilex的产品线规划显示了Intel对于不同市场需求的定义,在网络方面,一方面是更快的数据路径,一方面是基础设施架构优化和分散特性;在数据中心,融合工作负载需要加速,包括基础设施、应用和存储的加速;在5G,需要满足对不同阶段的快速响应和灵活性。
“只有Intel可以同时满足灵活性、快速优化、全面自定义和定制化选择这些选项,” Dorsey 说,“因为我们同时拥有FPGA、eASIC、ASIC和异构3D集成技术使我们形成了一个自定义逻辑体。”
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
FPGA
+关注
关注
1626文章
21665浏览量
601809 -
intel
+关注
关注
19文章
3480浏览量
185749 -
Agilex
+关注
关注
0文章
9浏览量
3740
发布评论请先 登录
相关推荐
FPGA加速深度学习模型的案例
FPGA(现场可编程门阵列)加速深度学习模型是当前硬件加速领域的一个热门研究方向。以下是一些FPGA加速深度学习模型的案例: 一、基于FPGA
Altera推出一系列FPGA软、硬件和开发工具
近期,英特尔子公司Altera推出了一系列FPGA软、硬件和开发工具,使其可编程解决方案更易应用于广泛的用例和市场。Altera在年度开发者大会上公布了下一代能效与成本优化的Agilex 3 FPGA情况,并宣布针对
FPGA做深度学习能走多远?
,共同进步。
欢迎加入FPGA技术微信交流群14群!
交流问题(一)
Q:FPGA做深度学习能走多远?现在用FPGA做深度学习加速成为一个热
发表于 09-27 20:53
FPGA在深度神经网络中的应用
、低功耗等特点,逐渐成为深度神经网络在边缘计算和设备端推理的重要硬件平台。本文将详细探讨FPGA在深度神经网络中的应用,包括其优势、设计流程、关键技术以及实际应用案例。
BittWare提供基于英特尔Agilex™ 7 FPGA最新加速板
BittWare 当前的加速板产品组合包括最新的英特尔 Agilex 7 FPGA F、I 和 M 系列,包括 Compute Express Link (CXL) 和 PCIe* 5.0
使用英特尔Agilex3和Agilex5器件构建下一代数据中心平台管理方案
凭借小巧的外形和高 I/O 规模等优势,低功耗、高度灵活且经过成本优化的英特尔 Agilex 3 和英特尔 Agilex 5 FPGA 以及 SoC FPGA 提供了下一代平台管理解决
FPGA在深度学习应用中或将取代GPU
现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型时面临的许多问题
在过去的十年里,人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司的股价也大幅
发表于 03-21 15:19
昨天看到消息Altera从Intel独立出来了,不知道大家常用的FPGA是什么?
昨天看到消息Altera从Intel独立出来了,不知道大家常用的FPGA是什么?我这边分成常规生产治具是altera的,算法和图像相关的使用的是Xilinx的;
发表于 03-06 13:39
英特尔携手Altera推出FPGA90现场可编程门阵列,多款产品同步发布
Agilex 7 F系列和I系列器件售价亲民且兼具高效性能,相较同类型FPGA产品每瓦性能提升两倍,特别适合数据中心、网络、国防等高带宽计算用途。
深度解读英特尔拆分FPGA业务的原因
不了解FPGA的朋友可能没听说过PSG,它是英特尔旗下的一个业务部门,前身是全球第二大FPGA公司Altera,也是我的前司。结果,就在我加入后不久啊,Altera就在2015年被英特尔花167亿美元收购了,这也是英特尔历史上最大的收购案,当时也是震惊了整个芯片行业。
发表于 12-13 10:34
•831次阅读
评论