0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PCIe Gen 2带来的东西不仅仅是额外的带宽

星星科技指导员 来源:嵌入式计算设计 作者:Touseef Bhatti 2022-06-23 11:03 次阅读

很难相信自 PCI 特别兴趣小组 (PCI-SIG) 发布 PCI Express Base Specification Revision 2.0 以来已经过去了两年。通常称为 PCIe Gen 2,升级到流行且广泛使用的 PCIe 协议后,PCIe Gen 1 支持的带宽翻了一番,达到 5.0 Gbps。但这并不是新规范的全部可能。

虽然第 2 代的市场采用正在顺利进行,但一些设计师仍然在他们的产品中依赖第 1 代,并且还没有准备好迁移到第 2 代。这些设计师可能没有意识到第 2 代正在带来更多的东西而不仅仅是额外的带宽。

开关成熟度

PCIe 开关是 PCIe 系统的标准构建块。由于芯片组提供有限数量的原生 PCIe 端口,因此交换机通常用于创建额外的 PCIe 端口。使用交换机允许芯片组扇出更多的 PCIe 端点或 I/O。

随着 PCIe 协议的成熟,它的实现也越来越成熟。芯片组过去带有一个 PCIe 端口,但现在通常支持多个 PCIe 端口。几年前,设计人员很难找到支持 PCIe 的嵌入式处理器。如今,支持两个甚至三个 PCIe 端口的嵌入式处理器很常见。

下一代功能

PCIe 交换机同样已经成熟。第 1 代交换机最初只是提供扇出功能,而第 2 代交换机则支持特定于应用程序的性能增强功能,例如读取步调和双播。

阅读节奏

当今的服务器和存储系统混合使用通过连接到 PCIe 的适配器实现的恒定和突发 I/O 的情况并不少见。光纤通道主机总线适配器 (FC HBA) 是一个恒定的、需要大量数据的端点的示例,它大部分时间都在向主机发送大量读取请求。另一方面,千兆以太网网络接口卡 (GE NIC) 是一个本质上是突发性的端点,会根据需要向主机发送少量、不频繁的读取请求。

在标准 PCIe 系统中,如果 GE NIC 在 FC HBA 已经发出大约 8 个读取请求之后发送一个小的读取请求,则 GE NIC 必须等待 CPU 处理完所有 8 个 FC HBA 读取请求,然后再处理一个GE 网卡读取请求。因此,GE NIC 性能会受到影响,因为它要花费几个周期来等待接收其请求的数据。FC HBA 读取请求往往比 GE NIC 的请求更大且更频繁,这一事实只会加剧 GE NIC 性能下降。这个问题是 PCIe 协议和 CPU 用于处理传入读取请求的先进先出 (FIFO) 方案的副产品。

读取步调通过在处理读取请求时公平分配 CPU 带宽来解决这个难题。在图 1 中,读取步调允许 GE NIC 跳到待处理的 FC HBA 读取请求之前,从而显着减少 GE NIC 的最坏情况等待时间。PCIe 交换机无需等待所有排队的 FC HBA 读取请求得到服务,而是允许 GE NIC 读取请求在队列中向前跳转。

图1

pYYBAGKz2BmATdF-AADyk_RKbRA971.png

虽然突发 I/O 性能可以体验 5 倍或更高的性能提升,但恒定 I/O 性能不会受到影响。read pacing 使用的算法考虑了恒定的 I/O 性能,并确保其性能不会下降。基于此算法,读取步调支持其自己的默认设置集合。但是,想要自定义读取步调功能的设计人员可以根据需要对自己的阈值进行编程

双铸

双播功能允许将一个入口数据包同时复制到两个出口端口——一个数据包输入,两个数据包输出。入口端口和两个出口端口是用户可编程的。每当数据包从选定的入口端口写入选定出口端口中的指定地址范围时,交换机都会自动生成出口数据包的副本并将该副本发送到第二个指定的出口端口。

在冗余和故障转移应用程序中,CPU 通常会将数据包的副本发送到冗余端点或辅助系统,以确保在系统崩溃时可以使用数据的备份副本。借助双重投射(如图 2 所示),PCIe 交换机减轻了 CPU 管理冗余流量的负担,将 CPU 需要执行的写入次数减少了一半。

图 2

poYBAGKz2CCAMp6aAAE3NY-UUCQ420.png

调试和诊断链接

除了这些特定于应用的性能特性之外,最新的 PCIe Gen 2 交换机还提供了许多可以加速系统启动的集成调试和诊断特性。

PCIe 数据包生成器

内置的 PCIe 数据包发生器允许设计人员以全线速 (5.0 Gbps) 运行 PCIe 交换机的外部链路。这款可编程发生器使设计人员能够创建自己的流量模式,其强大功能足以使 x16 Gen 2 链路饱和。数据包生成器在系统调试和启动期间非常有用,允许设计人员针对可定制的高密度流量测试他们的系统。

性能监控

集成的实时性能监视器允许设计人员通过使用 PCIe 交换机的 GUI 设计工具查看每个端口上的入口和出口性能,因为流量通过交换机。性能监控是完全被动的,因此对整体系统性能没有影响。内部计数器为流量和数据包类型提供了广泛的粒度。此外,设计人员可以修改示例应用程序代码以允许进一步定制,例如流量过滤。此功能对于暴露性能瓶颈、识别未充分利用的链路以及优化系统性能非常有用。

SERDES 眼图捕捉

设计人员可以使用开关的 SERDES 眼图捕捉功能在物理层评估系统的信号完整性,如图 3 所示。再次使用开关的软件工具,设计人员可以查看开关上任何通道的接收器眼图。此功能对于发现严重的信号完整性错误很有用,设计人员可以通过修改 SERDES 设置并查看调整对接收器眼图的影响来识别这些错误。

图 3

pYYBAGKz2CeAVxGrAAFM96b6G-E125.png

错误注入

错误注入允许设计人员将格式错误的数据包和/或致命错误注入他们的系统,从而使他们能够评估系统检测此类错误并从中恢复的能力。

缩小差距

除了没有理解 PCIe Gen 2 除了额外带宽之外的好处之外,一些设计人员还没有意识到从 Gen 1 到 Gen 2 的过渡比看起来要简单得多。根据 PCI Express 基本规范修订版 2.0 的要求,PCIe Gen 2 向后兼容 Gen 1。因此,包括交换机在内的所有 PCIe Gen 2 设备都与所有 Gen 1 设备相连。如图 4 所示,第 2 代交换机可用作第 1 代到第 2 代的桥接器

图 4

poYBAGKz2DCAYhG4AAHG7jLv3bo831.png

例如,使用传统 PCIe Gen 1 芯片组的设计人员可以使用 Gen 2 交换机连接到 Gen 1 端点。使用 Gen 2 交换机不仅提供各种性能和调试功能,还允许 Gen 2 端点之间的点对点流量以 5 Gbps 的速度运行,使 Gen 1 交换机提供的点对点性能翻倍。

相反,使用 Gen 2 芯片组的设计人员可以利用 Gen 2 交换机扇出到 Gen 1 端点。通过使用 Gen 2 交换机,设计人员可以利用 Gen 2 交换机内置的上述性能和调试功能,同时随着设计的发展获得连接到 Gen 2 端点的灵活性。

PCIe Gen 2 现在和现在

随着 PCIe 市场的不断扩大,PCIe 交换机的创新也在不断扩大。当今的第 2 代交换机提供高性能、集成的特定应用性能增强功能以及内置调试和诊断功能。插入第 2 代交换机是设计人员将其传统的第 1 代系统升级为支持第 2 代的最简单方法,从而使他们的系统在这个快速发展的市场中面向未来。

是呢环保局:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    453

    文章

    50296

    浏览量

    421276
  • 交换机
    +关注

    关注

    20

    文章

    2615

    浏览量

    99156
  • PCIe
    +关注

    关注

    15

    文章

    1213

    浏览量

    82383
收藏 人收藏

    评论

    相关推荐

    注意!无线模块不接天线不仅仅是影响传输距离

    无线模块的有效通信距离通常依赖于其发射功率和信号的传播能力。在没有天线的情况下,信号无法正常辐射,这将直接导致通信距离的显著降低。对于小功率模块而言,其原本有限的有效通信距离几乎会降为零;而对于大功率模块,尽管其理论上可以覆盖较大的范围,但在无天线情况下,其信号覆盖能力也会大打折扣。且数据传输可能会出现延迟、丢包等问题,严重影响用户体验。
    的头像 发表于 11-14 14:55 208次阅读
    注意!无线模块不接天线<b class='flag-5'>不仅仅是</b>影响传输距离

    慧明DM16数字调音台产品概述

    在数字调音台里面,信号处理芯片(DSP)是它的心脏。在我们慧明的DM16数字调音台里,它不仅仅是硬核,还是超级引擎!
    的头像 发表于 09-06 10:24 589次阅读

    不仅仅是节能,AI商业照明解决方案为地下停车场带来哪些想象空间?

    近日,国家发展改革委、市场监管总局、生态环境部等三部门联合印发《关于进一步强化碳达峰碳中和标准计量体系建设行动方案(2024—2025年)》,紧扣节能降碳重点领域发力,明确提出:对标国际先进水平,修订升级照明器具产品能效标准,扩大能效产品覆盖范围。如何将智能技术、绿色理念与建筑相结合,推动商业照明的可持续发展?如何减少商业空间的能耗浪费,提升能源利用效率,降
    的头像 发表于 08-14 15:39 286次阅读
    <b class='flag-5'>不仅仅是</b>节能,AI商业照明解决方案为地下停车场<b class='flag-5'>带来</b>哪些想象空间?

    五彩斑斓的芯片晶圆:不仅仅是科技的结晶

    在半导体行业中,芯片晶圆是核心组件,而在展示这些精密的科技产品时,人们常常会发现它们呈现出五彩斑斓的外观。这一现象并非偶然,而是由多种因素共同作用的结果。下面,我们将深入探讨为何芯片晶圆会展现出如此丰富的色彩。
    的头像 发表于 08-12 09:46 828次阅读
    五彩斑斓的芯片晶圆:<b class='flag-5'>不仅仅是</b>科技的结晶

    电源设计:同步整流带来不仅仅是高效率

    整流器允许电感电流在轻负载状态下反向流动。只需用一个二极管替换底部FET (Q2),电路便可转为非连续。尽管本文介绍的是降压拓扑结构的区别,但您会注意到所有电源拓扑都有类似的响应。 图2 同步运行
    发表于 07-11 11:17

    XCORE®.AI给音频制造业带来的无限希望

    在我们导航复杂的音频制造世界时,DSP和xcore.ai的融合成为一股变革力量。这不仅仅是将模拟转为数字;而是重新定义我们对音频处理的方式。凭借精度、适应性和结合AI的能力,xcore.ai站在前沿,提供一种超越传统DSP限制的动态解决方案。
    的头像 发表于 06-19 16:04 330次阅读
    XCORE®.AI给音频制造业<b class='flag-5'>带来</b>的无限希望

    求助,在CYW4373E上同时使用AP+IBSS时遇到的问题求解

    我 直接使用 Wifi,而不是 IBSS。IFX CYW4373E 的支持情况如何?芯片是否支持多车辆而不仅仅是点对点?
    发表于 05-30 07:52

    理想PLC程序的特征与标准

    一套完整的PLC程序,并不仅仅是使系统能够运行起来这么简单,它也需要完整的注释、精良的架构、良好的可扩展性、完备的报警保护系统、运行前的模拟系统。
    发表于 04-24 11:31 295次阅读
    理想PLC程序的特征与标准

    一个节电的叮咚门铃电路

    这个电路不仅仅是一个简单的双音门铃。相反,它利用包络调制来产生真实的“叮咚”铃声。
    的头像 发表于 02-25 14:28 833次阅读
    一个节电的叮咚门铃电路

    思必驰智能车载投影仪,让汽车秒变移动影院

    随着自驾旅行、户外露营的火热,汽车已不仅仅是代步工具,更向着移动的“第三空间”演化,为用户构建集消费、工作、娱乐于一体的“在路上的家”。
    的头像 发表于 01-26 11:30 1712次阅读

    PCIE相关概念和带宽计算方法

    传输速率为每秒传输量GT/s,而不是每秒位数Gbps,因为传输量包括不提供额外吞吐量的开销位;比如 PCIe 1.x和PCIe 2.x使用8b / 10b编码方案,导致占用了20% (
    的头像 发表于 01-16 14:42 1270次阅读
    <b class='flag-5'>PCIE</b>相关概念和<b class='flag-5'>带宽</b>计算方法

    硬件产品升级时的兼容性问题

    越来越多的硬件产品,硬件构成不仅仅是集成在一块板子上,而是多块控制板协同工作。
    的头像 发表于 01-12 11:08 419次阅读
    硬件产品升级时的兼容性问题

    e203 rom启动仅仅是引导到itcm执行指令吗?flash启动就是加载指令到itcm中吗?

    e203 rom启动仅仅是引导到itcm执行指令吗?flash启动就是加载指令到itcm中吗? rom代码不是存储器形式:(能否解释一下哎)
    发表于 01-10 07:05

    关于PLC编程规范及建议

    一套完整的PLC程序,并不仅仅是使系统能够运行起来这么简单,它也需要完整的注释、精良的架构、良好的可扩展性、完备的报警保护系统、运行前的模拟系统。
    发表于 12-19 09:58 458次阅读

    Redis 不仅仅是内存数据库

    除了用作缓存与主数据库之外,Redis还能够提供大量其他的底层技术用于解决业务问题,包括实时分析驱动决策、高性能、关键数据的故障转移和高速的数字支付等。文章速览:基于实时分析和库存管理做出更明智的决策实现数据和视频的流畅播放提供关键数据的故障转移服务实时批准数字支付加速数据库搜索缓存、数据库或是其他Redis用作缓存与主数据库的价值,是全球开发者一致认可的。
    的头像 发表于 11-26 08:05 318次阅读
    Redis <b class='flag-5'>不仅仅是</b>内存数据库