0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于英特尔发力FPGA的相关事件分析

lC49_半导体 来源:djl 作者:Timothy Prickett Morg 2019-09-05 09:25 次阅读

芯片巨头英特尔已经谈论 CPU-FPGA 复合计算很长时间了,以至于我们有时候不记得其 Xeon-Arria 混合计算单元并不是一款量产产品——这种计算单元是将一个 Xeon 服务器芯片和一个中端 FPGA 放入单个 Xeon 处理器插槽中。但英特尔正在努力攻坚这一领域,并且最近也向 The Next Platform 透露了当前的规划。

这种 CPU-FPGA 混合器件类似于 AMD加速计算单元(APU/Accelerated Computing Units),只是 APU 是将计算和 GPU 加速放入单个处理器封装中。CPU-FPGA 混合器件有望得到广泛的采用,尤其是想要将特定类型的负载从 CPU 迁移到加速器上的超大规模计算用户和云计算开发商。

尽管英特尔有自家的 GPU 并且也已经为特定的市场将其放入到了 CPU 封装中或 CPU die 上(比如基于 Xeon E3 芯片的用于加速媒体处理的低端工作站和低端服务器),但英特尔在将 Xeon 处理器上的负载迁移到其它器件上的热情并不高。它首先打造了并行 X86 处理器的 Knights 系列来作为辅助引擎,之后又将其做成了一款完整的处理器 “Knights Landing” Xeon Phi 7200,这款处理器在 2015 年底开始初步出货,并在 2016 年夏季正式发布。英特尔已经终结了 Knights Landing 芯片的协处理器版本,它们从未真正出货,因为客户只是需要使用可以运行他们自己的操作系统的 Xeon Phi 的托管版本。

也就是说,FPGA 和 GPU 一样,只是一种迁移计算负载的模式;英特尔正在努力将各种各样的 FPGA 配置带进这一领域,以确保计算负载确实能以某种形式从 Xeon CPU 迁移到 Xeon Phi(可用于传统的 HPC 和新兴的人工智能负载,主要是用于神经网络训练)或 Altera FPGA 或之前提到的那些低端的 CPU-GPU 混合器件。英特尔肯定不希望英伟达的 Tesla GPU 加速器或 AMD 的 Epyc CPU 和 Radeon Instinct GPU 组合占领这些市场。

英特尔在与 FPGA 制造商 Altera 达成了代工合作协议之后就开始谈论 Xeon-FPGA 混合计算器件了,Altera 也是英特尔的第一个这样的客户。之后两家合作一路深化,直到 2015 年 6 月,英特尔用 167 亿美元收购了整个 Altera。在今年休假离开之前负责管理英特尔的数据中心组的 Diane Bryant 曾在 2014 年 6 月即兴宣布了第一款 CPU-FPGA 器件,那是在英特尔收购 Altera 的一年之前。那时候,Bryant 说向这种计算复合体中加入 FPGA 可以提供多达 10 倍的加速,这可以通过使用 QuickPath Interconnect(QPI)链路直接将 FPGA 连接到 Xeon 处理器上实现。该链路通常用于多处理器系统中的 NUMA 扩展,相比于使用 PCI-Express 外设总线,它的性能可高出 20 倍。

英特尔最后真的收购了 Altera,这没什么惊奇的。Altera 是 FPGA 领域的两大主要玩家之一,另一家是赛灵思(Xilinx)。如果非要说有让人惊讶的地方,那就是英特尔出的钱太多了,毕竟 Altera 的年收入还不到 20 亿美元。英特尔和 Altera 的这笔交易也让我们看到了英特尔的担忧。这家公司将会使用 FPGA 来对抗 GPU,之后该公司还表示预计在 2020 年之前,三分之一的云开发商(也包括超大规模计算用户)的系统中都会使用 FPGA。由于 FPGA 在一些负载上有 10 到 20 倍的性能优势,加上数量巨大,所以可能会给 Xeon 的销量带来巨大影响。(目前我们尚未看到这种效果,但想象一下如果用 CPU 来实现深度学习奇迹,得需要多少 CPU 和多高的成本。这方面的创新可能根本就没有发生过。)

到目前为止,英特尔 Xeon 还在热销,即使 FPGA 和 GPU 等加速器正在侵蚀 Xeon 的业务。除了 SmartNIC 网络接口和其它网络功能虚拟化工作,FPGA 也已被用于执行服务器加密以及加速关系数据库,正如 Swarm64 做的那样。在一些案例中,FPGA 卡有自己的内存和计算,只将一些核心的串行任务交给 CPU 做,比如来自 Nallatech 的双 FPGA 协处理器就是这样。

顺便一提,让 FPGA 与处理器协同工作并不是什么新花样。赛灵思和 Altera 都在同一个片上系统封装中集成 FPGA 和 ARM 处理器很多年了,而且英特尔本来也可以在用于超大规模计算的 Xeon D X86 芯片设计上做同样的事。事实上,这个本可以做到的事情后来造就了第二代测试台 CPU-FPGA 混合器件,英特尔在 2016 年 3 月展示了这种器件。

英特尔可编程解决方案组的 FPGA 软件解决方案高级总监告诉 Bernhard Friebe 说,这种器件在同一个封装中放入一个 15 核的 Broadwell Xeon 处理器和一个 Arria 10 FPGA,这不是 Stratix 10 一样的顶级部件。该器件使用了英特尔的 14nm 工艺生产,目前正在实验性生产,有望在今年年底前开始出货。

英特尔采用的是双管齐下的 FPGA 战略:一是 CPU-FPGA 混合器件,比如共享同一个插槽的 Broadwell-Arria 封装;二是分立的 Xeon CPU 与 Arria 或 Stratix FPGA 通过 PCI-Express 总线彼此相连。

据 Friebe 说,英特尔的当前计划是基于 Arria 10-GX FPGA 打造自己的 PCI-Express 卡,英特尔将其称为可编程加速卡(PAC/programmable acceleration card),并计划在 2018 年上半年开始销售。后面也会有基于 Stratix 10 FPGA 的 PAC,但英特尔没说什么时候会有。我们估计大概在 2018 年年底。

英特尔的 CPU-FPGA 混合器件包含一款尚未命名的 “Skylake” Xeon SP 处理器加 Arria 10 FPGA 组合器件。这些 CPU-FPGA 混合器件将会在实验性的 Broadwell-Arria 器件基础上继续前进,并会使用更快的 UltraPath Interconnect(UPI)链路在一个 Socket P 插槽中将 FPGA 直接连接到 Skylake 芯片。我们也知道这是一种单插槽机器,所以这可能意味着会有一个 bin 相对低的 Skylake 部件(也许是 Silver 或 Bronze),也可能只有一个 UPI 链路。(更多不一定更好。)

目前还不清楚这两个计算元件之间的链路数量是 1 还是 2 还是 3,但是鉴于 Skylake 可以有 1、2 或 3 个 UPI 端口,根据模型的不同,这三者皆有可能。我们也不清楚英特尔打算在这两个器件之间使用什么一致性模型,但很显然这能让 CPU 和 FPGA 可以读写同一个内存并且无需在两个器件传递数据——不管是直接传递还是使用虚拟寻址移动指针。如果英特尔选择 CCIX、Gen-Z 或 OpenCAPI 这三种新兴的协议,情况就会相当有趣,因为这些协议在器件之间提供的一致性能使得内存寻址对编程者而言不可见。我们应该会看到。

我们可以确定地说英特尔正在专注研发编程环境,这样不管 CPU 和 FPGA 是分立的还是混合在同一个插槽中,都能使用同样的工具。英特尔将其称为 Acceleration Stack,这是一个基于 OpenCL 的完备的编程环境。OpenCL 是一种常用的高级编程语言,可以与 Verilog 和 VHDL 配合用于 FPGA 开发。

这种用于 FPGA 的 Acceleration Stack 是专门为英特尔器件设计的。据 Friebe 说,Acceleration Stack 组合了英特尔的系统与 FPGA 的固件与 Open Programmable Acceleration Engine(OPAE)开源框架。其中包含用于运行在裸机上的操作系统的实体 FPGA 驱动和一个虚拟 FPGA 驱动——这个虚拟 FPGA 驱动可以运行在服务器虚拟化管理程序之下,从而可在虚拟机上实现功能。

英特尔的想法是构建一个一致的 API 集合,可通过 C 语言访问,可以用于混合或分立的设置,并且像 OPAE 代码一样开源,在 GitHub 上放养。这个 FPGA API 使用了 BSD 许可,这个 FPGA 驱动使用了 GNU GPLv2 许可。有很多公司必须获得许可的 OpenCL 工具,英特尔也有自己的,称为 Intel FPGA for OpenCL,它可以进行各种优化以便在 FPGA 上运行。

如果这些工具能吸收 C 语言代码并将其转换成 OpenCL 代码,然后转换成 VHDL,那么这可能会非常有用。我们预计,有了这个 OPAE 软件层,这个堆栈中更高层的应用框架就会与 OPAE 通信以便将负载迁移到 FPGA 上,这样可以极大简化编程任务。当然,OpenCL 代码也会被自动编译成 FPGA 可用的 VHDL。

关于英特尔发力FPGA的相关事件分析

英特尔关注的核心是让 FPGA 编程更简单,同时也保持其两大分支的一致性。FPGA 本质上编程就更难一些。你怎么看待介于硬件和软件中间的东西?

也许最有意思的地方在于英特尔非常坚定地要使用 FPGA 来加速机器学习负载,尤其是用于推理阶段,而且它还将为此推出自己的预配置 FPGA 算法,其客户可以像获取软件一样获得这些算法的许可。这也是大概两年半之前出现关于英特尔收购 Altera 的传言时我们所做过的预测。

关于英特尔发力FPGA的相关事件分析

但英特尔在人工智能方面有很多不同的计划齐头并进,不知道他们的客户会做何选择。

我们一直疑惑的是该在什么时候使用混合设置,又该在什么时候使用分立的 CPU 和 FPGA 设置。混合器件的计算能力中规中矩,但却有更高的内存带宽和更低的延迟;分立方法则可以组合更多 CPU 计算(使用 Xeon SP 的 2、4 或 8 插槽)和更多 FPGA 计算(可以加入多达 16 个 PCI-Express 卡,在服务器中有 8 个。FPGA 本身有大量不同的连接和 I/O 选择,因为这也可以使用 VHDL 编程。

“根据你想做的事情的不同,有很多不同的使用模式。”Friebe 说,“集成解决方案主要用作旁路加速器。数据进入 CPU,然后它将任务分配给 FPGA,结果又返回 CPU,你就得到了加速。使用分立的卡时,你可以扩展到其它使用模式。比如,你可以在在线的或流传输的模式中使用这样的 FPGA,其中数据可以经由高带宽接口直接输入 FPGA;然后经过 PCI-Express 链路,这些经过 FPGA 加工过的数据可以被发送到 CPU 做进一步处理。”

也可能有一些场景需要在同一个系统中同时使用这两种方法,毕竟过去发生过更奇怪的事情。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1624

    文章

    21589

    浏览量

    600963
  • 英特尔
    +关注

    关注

    60

    文章

    9842

    浏览量

    171184
  • 人工智能
    +关注

    关注

    1789

    文章

    46529

    浏览量

    236780
收藏 人收藏

    评论

    相关推荐

    刚刚!英特尔最新回应

    10月17日消息,据环球时报报道,中国网络空间安全协会发文,披露英特尔产品安全漏洞问题频、可靠性差、监控用户、暗设后门等问题,“建议启动网络安全审查”! 该协会表示,从2023年开始,英特尔CPU
    的头像 发表于 10-17 17:35 162次阅读
    刚刚!<b class='flag-5'>英特尔</b>最新回应

    英特尔股票分析英特尔的困境能否结束?

    来源:猛兽财经   作者:猛兽财经     猛兽财经的核心观点: (1)英特尔面临的挑战:第一季度财报不及预期后股价下跌。 (2)猛兽财经对英特尔股票的技术分析:短线交易者需谨慎,多头头寸等待突破
    的头像 发表于 10-09 16:28 165次阅读
    <b class='flag-5'>英特尔</b>股票<b class='flag-5'>分析</b>:<b class='flag-5'>英特尔</b>的困境能否结束?

    面对高通收购,Apollo 50亿美元投资,你该买入英特尔股票吗?

    财经认为高通收购英特尔大概率不会成功,而且英特尔将强烈反对。 (5)猛兽财经对英特尔股票的技术分析:支撑位:19美元,阻力位:25美元。 Apollo将投资
    的头像 发表于 09-25 16:34 201次阅读
    面对高通收购,Apollo 50亿美元投资,你该买入<b class='flag-5'>英特尔</b>股票吗?

    英特尔是如何实现玻璃基板的?

    在今年9月,英特尔宣布率先推出用于下一代先进封装的玻璃基板,并计划在未来几年内向市场提供完整的解决方案,从而使单个封装内的晶体管数量不断增加,继续推动摩尔定律,满足以数据为中心的应用的算需求
    的头像 发表于 07-22 16:37 250次阅读

    BittWare提供基于英特尔Agilex™ 7 FPGA最新加速板

    BittWare 当前的加速板产品组合包括最新的英特尔 Agilex 7 FPGA F、I 和 M 系列,包括 Compute Express Link (CXL) 和 PCIe* 5.0
    的头像 发表于 04-30 15:22 746次阅读
    BittWare提供基于<b class='flag-5'>英特尔</b>Agilex™ 7 <b class='flag-5'>FPGA</b>最新加速板

    英特尔旗下FPGA公司Altera正式亮相

    日前,英特尔 FPGA Vision线上直播中发布,将英特尔编程解决方案事业部 (PSG) 作为独立的FPGA公司——Altera。
    的头像 发表于 03-18 14:11 474次阅读

    英特尔成立全新独立运营的FPGA公司Altera

    近日,英特尔宣布成立全新的独立运营的FPGA(现场可编程门阵列)公司——Altera,此举标志着英特尔FPGA领域的进一步深耕和战略布局。在FPG
    的头像 发表于 03-11 10:07 497次阅读

    英特尔旗下Altera正式独立运作,FPGA市场将迎来怎样的巨变?

    在当天英特尔FPGA Vision线上直播大会上,Altera公司首席执行官Sandra Rivera宣布,英特尔FPGA芯片部门开始作为独立业务营运,并全面展示其未来蓝图和战略目标。
    的头像 发表于 03-05 18:14 4365次阅读
    <b class='flag-5'>英特尔</b>旗下Altera正式独立运作,<b class='flag-5'>FPGA</b>市场将迎来怎样的巨变?

    英特尔1nm投产时间曝光!领先于台积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    英特尔登顶2023年全球半导体榜单之首

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月01日 11:55:16

    深度解读英特尔拆分FPGA业务的原因

    不了解FPGA的朋友可能没听说过PSG,它是英特尔旗下的一个业务部门,前身是全球第二大FPGA公司Altera,也是我的前司。结果,就在我加入后不久啊,Altera就在2015年被英特尔
    发表于 12-13 10:34 807次阅读

    英特尔:玻璃基板将推动算提升

    的应用的算需求。        虽然玻璃基板对整个半导体行业而言并不陌生,但凭借庞大的制造规模和优秀的技术人才,英特尔将其提升到了一个新的水平。近日,英特尔封装测试技术开发(Assembly Test Technology D
    的头像 发表于 12-06 09:31 398次阅读

    英特尔Agilex 3 FPGA产品家族介绍

    随着英特尔 Agilex 3 FPGA 的推出,Agilex 产品家族将拥有高低端全套 FPGA 产品,所有产品都由我们充满韧性的全球供应链全力打造。
    的头像 发表于 11-24 12:28 879次阅读

    英特尔 FPGA的新品及全矩阵应用

    在技术日中,英特尔推出了六款FPGA新产品和平台,其中包括:Agilex 3、Agilex 5、Agilex 7、Nios V软核处理器、开放式FPGA堆栈(OFS)、F2000 IPU平台。在2023年底,还会有约10款新产品
    发表于 11-17 18:26 628次阅读
    <b class='flag-5'>英特尔</b> <b class='flag-5'>FPGA</b>的新品及全矩阵应用

    创新加速,英特尔以全矩阵FPGA助产业智能化发展

    11月14日,以“创新加速,塑造FPGA芯未来”为主题的2023年英特尔®FPGA中国技术日在北京成功举行。期间,英特尔不仅披露了包括Agilex®3系列、Agilex®5系列在内的多
    发表于 11-15 08:52 271次阅读
    创新加速,<b class='flag-5'>英特尔</b>以全矩阵<b class='flag-5'>FPGA</b>助产业智能化发展