0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Agilex 7 FPGA和SoC的基准测试

英特尔FPGA 来源:英特尔FPGA 2024-08-30 17:07 次阅读

与同类FPGA相比,Agilex 7 FPGA可为OpenCores公开发布的设计提供超过一个速度等级的内核性能提升。

简 介

本文介绍了一种对Agilex 7 FPGA产品家族的内核性能进行基准测试的方法,旨在清晰地展示相关方法和数据,以便感兴趣的读者可以重新生成和分析这些结果。

背景:FPGASoC的基准测试

当前,可编程逻辑行业尚无标准的指标评测方法。为此,使用了严格的内部分析,并广泛地采用了不同的设计组合,以充分了解、量化可编程逻辑产品相比前代产品/行业同类产品的性能。这些设计从不同的细分市场收集而来,包括高性能计算、图像和视频处理、有线和无线通信以及消费类产品等。此外,这些设计还使用了多种实施技术,包括来自行业同类产品的ASIC和FPGA。通过使用广泛的设计套件,致力于确保结果准确无误,且能够代表客户设计与Quartus Prime Software Suite等FPGA设计工具之间的复杂交互。为了使用客户设计,已在转换设计方面投资了大量资源,以便能够与广泛的合成工具和电子设计自动化(EDA)厂商合作。同时还确保功能予以保留,并针对特定FPGA厂商进行了适当的代码优化,这点是必需的,因为开发设计时通常会针对特定FPGA对设计进行优化。

在性能比较方面,采用的是尽力而为法,目的是显示可实现的最佳结果。尽力而为编译方法实验需要比默认按钮(push-button)编译更长的单独编译时间,而且,在该方法中,每项设计需要进行超过一次的编译。

借助这种方法,确定了Agilex 7 FPGA和SoC可提供比7纳米FPGA行业同类产品更高的内核性能,测量指标为在设计套件的每项设计中,针对速度关键型时钟路径所能实现的最大fMAX。

性能差异在13%-25%左右(具体数据取决于不同的设计),大约相当于一个或两个速度等级优势,一个速度等级通常被定义为10%-15%†的性能差异。这些结果有力证明了Agilex 7 FPGA作为最高性能10纳米FPGA产品家族的地位。然而,由于这些结果是专有设计获得的,所以只能就这项分析分享有限的详情,这最终会限制这些信息对可编程逻辑用户的有用性。

通过基于OpenCores的性能比较提高透明度

为了克服在理解可编程逻辑性能方面的挑战,使用已发布的OpenCores(www.opencores.org)设计进行指标评测。OpenCores提供了开源硬件知识产权(IP)内核。这项指标评测旨在帮助可编程逻辑用户:

了解性能评估过程中使用的具体设计,包括这些设计具体到寄存器传输级(RTL)描述的详细信息

自己重新生成分析结果

仔细查看分析结果,以更好地了解Agilex 7 FPGA性能和器件利用率,以及这些性能优势对于特定设计的意义

这项基于OpenCores的分析的范围小于使用的内部分析,因为前者专注于受时间约束的比较。分析并不全面,但分析结果说明了实施相似设计,或实施与设计示例套件所用功能相似的功能设计时,Agilex 7 FPGA相比行业同类器件的相对性能。

OpenCores标记方法

OpenCores设计只使用了目标设备中的一小部分资源,只使用这一小部分资源并非用户的惯例,也达不到他们所期望的目标。此外,随着设备资源逐渐被耗尽,以及设计变得更难以放置和路由,不断增加的利用率通常会对可实现的最高fMAX产生不利影响。为了模拟设备利用率对可编程逻辑性能的影响,OpenCores设计执行了大量编译,而且每次都会在前一次编译的基础上添加更多OpenCores实例。为了增加可编程逻辑设备的设计尺寸,每项OpenCores设计都在FPGA中重复进行了实例化(对同一内核进行多次标记):

每次标记都并行实施

添加I/O包装程序逻辑以减少更大设计所需的I/O引脚数

内核与包装程序逻辑之间不存在时间关键路径

包装程序逻辑提供了尽可能少的开销。图1显示了标记过程

wKgZombRjDaAOFsmAACAJSyWNzo496.jpg

图1. 在FPGA中对oc_m1_core设计进行了四次实例化

OpenCores标记和基准测试方法

随着OpenCores设计标记数量增加(因此设计尺寸不断增加),I/O引脚和全局时钟等资源变得有限。为了避免引脚用尽,每个OpenCores设计都包裹在移位寄存器中,以便一个物理引脚能够为内核的所有输入引脚提供信息,以及内核的所有输出引脚都将信息输入到可加载的移位寄存器中。图2和图3分别显示了输入和输出移位寄存器。移位寄存器尺寸取决于I/O引脚数量,移位寄存器的数量取决于FPGA中实施的OpenCores设计数量。

wKgaombRjDaAYfmEAAA00PCS7M0077.jpg

图2. 输入移位寄存器实施

wKgZombRjDaAFZyFAABIaH0jNwU038.jpg

图3. 输出移位寄存器实施

为了避免全局时钟资源耗尽,一个引脚直接为所有OpenCores设计提供全局时钟和重置信号。例如,如果一个内核需要两个时钟(即内核时钟1与内核时钟2)以及一个重置信号,内核时钟1的所有实例由一个引脚提供,内核时钟2的所有实例由另一个不同的引脚提供,重置信号的所有实例由第三个引脚提供。借助该方法,所有OpenCores设计都拥有相同的时钟和重置信号(请参见图4)。

wKgaombRjDaAW0ZSAAB1YJlEUrg584.jpg

图4. 共享时钟和重置信号的双核实施

在FPGA中,包装程序逻辑将所有OpenCores设计相连接后,为确保包装程序逻辑(即移位寄存器)和OpenCores设计之间不存在关键路径。为了实现这一目标,创建了错误的路径,同时通过为内核时钟和包装程序逻辑时钟设置不同的无关时钟域,消除了时间路径。然后,这些设计工具可将内核和移位寄存器分开优化。在设备和设计工具允许的情况下,对OpenCores设计进行了尽可能多的实例化,且无编译错误。

软件工具、设置与约束

为了开展这项研究,使用了分析时可用的所需FPGA开发工具的最新版本:

Quartus Prime Software Suite版本22.4

把工具安装并运行于Linux64设备之上。这些可编程逻辑工具提供的设置在设计性能、逻辑资源使用、编译时间和内存使用之间进行了折中。需要注意的是,某些设计可能使用特定设置生成最佳结果,但这并不意味着该设置适用于另一项设计。此外,用于指引EDA工具的用户约束可改善结果。即便使用代表客户设计的设计集,指标评测结果也会因软件设计和应用约束的不同而存在显著差异。对于本文介绍的比较,使用了尽力而为的编译模式,并设置了较为严格的时间约束。为了确定每项设计的严格时间约束,对每个OpenCores设计时钟应用了频率约束,以确定每个时钟刚好无法满足的约束。通过不断增加约束直至无法满足,确定了基础约束。然后,通过将基础约束值乘以最少1.3的系数,确定了严格约束。下面部分介绍了为每项设计应用的约束。

结 语

Agilex 7 FPGA家族实现了更高的fMAX值,范围在3%到41%之间,几何平均值为20%。性能优势相当于一到两个速度等级。此外,结果表明,在利用率较高的情况下,Agilex 7 FPGA性能稳定性更好,在这种情况下,Hyperflex 架构能提供更高的性能,让您可以更充分地利用可用逻辑。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1620

    文章

    21497

    浏览量

    598708
  • 寄存器
    +关注

    关注

    31

    文章

    5249

    浏览量

    119159
  • 内核
    +关注

    关注

    3

    文章

    1336

    浏览量

    40075
  • soc
    soc
    +关注

    关注

    38

    文章

    4014

    浏览量

    216974
  • Agilex
    +关注

    关注

    0

    文章

    9

    浏览量

    3727

原文标题:Agilex ™ 7 FPGA在OpenCores中展示性能优势

文章出处:【微信号:英特尔FPGA,微信公众号:英特尔FPGA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    贸泽开售用于PCIe 4.0 设计的Intel Agilex F系列FPGA开发套件

    贸泽电子供应的Intel Agilex F系列FPGA开发套件搭载Agilex F系列FPGA,含1400 KLE,并采用2486 球的BGA封装。
    发表于 02-04 14:05 2600次阅读

    深度解读:Intel最新的FPGA Agilex

    Intel终于发布了他们最新的FPGA——Agilex,但是,这是一颗传统意义上的FPGA吗?还是Stratix 10的升级版?
    的头像 发表于 04-03 09:08 1.4w次阅读

    Agilex FPGA看英特尔如何设计产品新模式

    Agilex是Agile(敏捷)和Flexible(灵活)两个词语的结合体,而这两个特点也正是现代FPGA技术最为核心的两大要点。
    发表于 07-11 15:02 437次阅读

    Agilex FPGA,现代FPGA技术的核心力量

    Agilex是Agile(敏捷)和Flexible(灵活)两个词语的结合体,而这两个特点也正是现代FPGA技术最为核心的两大要点。
    发表于 11-18 15:25 1294次阅读

    英特尔Agilex FPGA家族全系列概述表

    40%。英特尔 Agilex SoC FPGA 还集成了四核 Arm* Cortex-A53 处理器,可提供高系统集成水平。 Agilex FPG
    的头像 发表于 03-12 15:36 3545次阅读

    解密英特尔® AgilexFPGA家族的八大特性

    提升多达 40%,将数据中心、网络和边缘计算应用的功耗降低多达 40%。英特尔 Agilex SoC FPGA 还集
    的头像 发表于 04-07 16:51 2076次阅读

    基于英特尔®AGILEXFPGASOC FPGA的BittWare加速“双星”发布

    BittWare 在之前发布的 IA-840F 企业级 FPGA 加速器中添加了两款基于英特尔 Agilex FPGASoC FPGA
    的头像 发表于 06-30 10:48 2234次阅读

    全新英特尔Agilex D系列FPGASoC适用于中端FPGA应用

    全新英特尔 Agilex D 系列 FPGASoC 具备多项新特性,例如升级版硬核处理器系统 (HPS)、采用 AI 张量模块的增强型数字信号处理 (DSP)、MIPI I/O 支持和固核
    的头像 发表于 11-03 16:08 995次阅读

    全新英特尔® AgilexFPGASoC 家族产品解析

    这些技术上的进步,使新产品具有外形规格更小、功耗已优化等特性,因此适用于多种应用,包括工业、广播、汽车、通信、消费、测试和测量以及医疗市场的不同工作负载。这一英特尔 Agilex FPGA
    的头像 发表于 11-17 15:02 819次阅读

    英特尔® Agilex™ D系列FPGASoC适用于中端FPGA应用

    全新英特尔 Agilex D 系列 FPGASoC 具备多项新特性,例如升级版硬核处理器系统 (HPS)、采用 AI 张量模块的增强型数字信号处理 (DSP)、MIPI I/O 支持和固核 IP 时间敏感网络 (TSN)
    的头像 发表于 11-23 15:23 665次阅读

    使用英特尔® AgilexFPGA 解决以数据为中心的挑战

    使用英特尔® AgilexFPGA 解决以数据为中心的挑战
    的头像 发表于 01-04 11:17 630次阅读
    使用英特尔® <b class='flag-5'>Agilex</b>™ <b class='flag-5'>FPGA</b> 解决以数据为中心的挑战

    英特尔Agilex FPGA的优势和特性

    英特尔推出全新英特尔 Agilex 7 FPGA,以支持在英特尔 DevCloud 中运行 oneAPI 基础工具套件(基础套件)工作负载,使您能够利用基于全新英特尔 FPGA 的高性
    的头像 发表于 09-08 09:09 889次阅读

    英特尔Agilex 3 FPGA产品家族介绍

    随着英特尔 Agilex 3 FPGA 的推出,Agilex 产品家族将拥有高低端全套 FPGA 产品,所有产品都由我们充满韧性的全球供应链全力打造。
    的头像 发表于 11-24 12:28 792次阅读

    使用英特尔Agilex3和Agilex5器件构建下一代数据中心平台管理方案

    凭借小巧的外形和高 I/O 规模等优势,低功耗、高度灵活且经过成本优化的英特尔 Agilex 3 和英特尔 Agilex 5 FPGA 以及 SoC
    的头像 发表于 04-26 14:31 684次阅读
    使用英特尔<b class='flag-5'>Agilex</b>3和<b class='flag-5'>Agilex</b>5器件构建下一代数据中心平台管理方案

    BittWare提供基于英特尔Agilex7 FPGA最新加速板

    BittWare 当前的加速板产品组合包括最新的英特尔 Agilex 7 FPGA F、I 和 M 系列,包括 Compute Express Link (CXL) 和 PCIe* 5.0
    的头像 发表于 04-30 15:22 678次阅读
    BittWare提供基于英特尔<b class='flag-5'>Agilex</b>™ <b class='flag-5'>7</b> <b class='flag-5'>FPGA</b>最新加速板