0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

将FPGA灵活应变的计算加速与低时延连接结合

YCqV_FPGA_EETre 来源:Xilinx赛灵思官微 作者:Xilinx赛灵思官微 2021-05-13 14:13 次阅读

随着后疫情时代的来临,大多数人依然在采用线上视频会议的工作方式 但是您是否曾经想过 所有会议内容和数据的传输需要怎样的技术? 面对疫情造成的前所未有的视频流量激增 数据中心运营商也开始重新思考其当前架构并探索在本质上更便于扩展且效率更高的新配置在此背景下 一种有望大幅提升资源利用率的新架构正在兴起 这就是“可组合式基础设施”

可组合式基础设施

可组合式基础设施能够解耦资源并将资源汇集,从而实现了资源的随处调用。它还能为工作负载提供数量恰好的资源,并经由软件迅速完成重新配置。 可组合式基础设施由 CPU 池、SSD 池和加速器池构成,它们互联在一起并由基于标准的配置框架控制,能极大提高数据中心的资源利用率。在这样的架构中,不同的工作负载可能有不同的计算、存储和加速要求,而资源将进行相应分配,避免浪费硬件资源。

时延挑战

上述方法在理论上似乎很完美,但实际上存在一个严重的问题:时延。当您分解资源并将它们移得更远的时候,就会因 CPU 和 SSD 或 CPU 与加速器之间的网络流量而导致延迟增大和带宽缩小。除非您有某种方法来减少网络流量并提高资源间的互联效率,否则这会造成严重的限制。在解决时延难题方面,FPGA 能发挥三大关键作用:

将 FPGA 作为灵活应变的加速器,针对每种工作负载进行定制以实现最佳性能;

FPGA 让算力贴近数据,从而降低时延,并最大限度缩小所需带宽;

FPGA 的灵活应变智能架构能够在不产生额外延迟的情况下实现资源的高效率池化。

灵活应变的加速

基于 FPGA 的计算加速器的第一大优势就是显著提升如今亟需的工作负载的性能。在实时视频流应用的视频转码用例中,FPGA 解决方案的性能通常比 x86 CPU 高出 30 倍,这有助于数据中心运营商解决并发流大幅增加的问题。另一个示例是在基因组测序的关键领域。一位近期成为赛灵思客户的基因组研究机构发现,基于赛灵思 FPGA 的加速器能以比 CPU 快 90 倍的速度获得结果,帮助医疗研究人员以过去几分之一的时间完成 DNA 样本测试。

让算力更贴近数据

可组合式数据中心内的 FPGA 能发挥的第二大优势是,让灵活应变的算力贴近数据。在 SmartSSD 计算存储器件中使用赛灵思 FPGA,能为过去一般由 CPU 运行的高速搜索、解析、压缩和加密等功能提速。这有利于卸载 CPU,将其用于更复杂的任务,而且还有助于减少 CPU 和 SSD 之间的流量,从而减少带宽消耗并降低时延。 与之类似,赛灵思 FPGA 现在也用在 SmartNIC 中。例如赛灵思新款 Alveo SN1000,它不仅能为活动数据加速,提供线速数据包处理、压缩和加密服务,还能针对特定数据中心或客户适应定制的切换要求。

智能架构

如果将 FPGA 灵活应变的计算加速与低时延连接结合,便会使得可组合式数据中心更进一步。您可以将高计算强度的工作负载分配给采用自适应智能架构互联的加速器集群,按需创建高性能计算机。 当然,如果不能以最优加速算法为计算加速器、SmartSSD 和 SmartNIC 编程,然后按正确数量将它们配置给每个工作负载,那么这些好处都是空谈。在这方面,我们已经开发出一个综合全面的软件协议栈,它利用 TensorFlow 和 FFMPEG 等特定领域行业框架,并配合赛灵思的 Vitis 开发平台运行。在智能资源分配方面, RedFish 等更高级的配置框架也有用武之地。 在可组合式数据中心掀起的激动人心的变革中 赛灵思器件和加速器卡将成为新型高效架构的关键模块依托快速的可重配置能力、低时延以及能够适应不断变化的工作负载的灵活架构赛灵思已经为在这场变革中发挥重大作用做好准备

原文标题:可组合数据中心:让算力更贴近数据

文章出处:【微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1628

    文章

    21723

    浏览量

    602897
  • 数据
    +关注

    关注

    8

    文章

    6992

    浏览量

    88935

原文标题:可组合数据中心:让算力更贴近数据

文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    振弦式表面应变计钢支撑计算

    振弦式表面应变计通常安装在混凝土构件或钢支撑表面,用于测量这些结构物的应变量。针对振弦式表面应变计在钢支撑上的计算,主要涉及应变量的
    的头像 发表于 11-12 16:09 262次阅读
    振弦式表面<b class='flag-5'>应变</b>计钢支撑<b class='flag-5'>计算</b>

    2.34纳秒超低时,满足金融市场高频交易,AMD发布新一代金融加速

    是降低成本和获得利润的关键所在。   近日,AMD推出Alveo UL3422 加速卡,它是由 AMD Virtex UltraScale+ FPGA 提供支持,其采用新颖的收发器架构,具备硬化且经过优化的网络连接核,专为高速交
    的头像 发表于 11-11 01:13 1466次阅读
    2.34纳秒超低时<b class='flag-5'>延</b>,满足金融市场高频交易,AMD发布新一代金融<b class='flag-5'>加速</b>卡

    GPU加速计算平台是什么

    GPU加速计算平台,简而言之,是利用图形处理器(GPU)的强大并行计算能力来加速科学计算、数据分析、机器学习等复杂
    的头像 发表于 10-25 09:23 242次阅读

    FPGA加速深度学习模型的案例

    FPGA(现场可编程门阵列)加速深度学习模型是当前硬件加速领域的一个热门研究方向。以下是一些FPGA加速深度学习模型的案例: 一、基于
    的头像 发表于 10-25 09:22 211次阅读

    应变片的灵敏系数是什么,它与电阻丝连接方式

    为灵敏系数或Gage Factor)是描述应变片对应变变化响应程度的参数,它定义为应变片电阻变化与应变的比值。 应变片的灵敏系数与其电阻丝的
    的头像 发表于 09-21 10:43 1282次阅读

    基于菲数科技FA728Q加速卡实现LLT应用

    菲数科技使用Stratix 10 FPGA和开源的开放式FPGA堆栈(OFS)基础设施开发高性能FPGA加速卡。
    的头像 发表于 08-30 17:13 502次阅读
    基于菲数科技FA728Q<b class='flag-5'>加速</b>卡实现<b class='flag-5'>低</b>时<b class='flag-5'>延</b>LLT应用

    FPGA在人工智能中的应用有哪些?

    定制化的硬件设计,提高了硬件的灵活性和适应性。 综上所述,FPGA在人工智能领域的应用前景广阔,不仅可以用于深度学习的加速和云计算加速,还
    发表于 07-29 17:05

    基于FPGA的类脑计算平台 —PYNQ 集群的无监督图像识别类脑计算系统

    神经元更有可能赢得竞争胜利。在训练仿真结束后,S2 中赢得竞争胜利的神经元最具特征, C1 中与其连接 36 个 STDP 突触权重作为训练好的特征权重。 2.2 FPGA 集群的类脑
    发表于 06-25 18:35

    电阻应变片的连接方式有哪些?

    电阻应变片,通常称为应变片,是一种机械应变转换为电阻变化的传感器。它们广泛应用于各种工程领域,包括材料测试、结构健康监测和振动分析等。
    的头像 发表于 05-16 15:51 1904次阅读

    借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

    灵活应变能力以实现工作负载优化。Alveo V80 加速卡现已量产出货,其能提供较之上一代加速卡至高 2 倍的带宽与计算密度1,并为使用 AMD Vivado™ 设计套件的
    发表于 05-16 14:09 214次阅读
    借助全新 AMD Alveo™ V80 <b class='flag-5'>计算</b><b class='flag-5'>加速</b>卡释放<b class='flag-5'>计算</b>能力

    HarmonyOS实战开发-如何实现音频录制和播放,AudioVivid音乐播放的相关功能

    介绍 本示例主要展示了音频录制和播放,AudioVivid音乐播放的相关功能: 录制。
    发表于 05-11 20:26

    AMD日前推出Ryzen(锐龙)嵌入式8000系列处理器

    AMD 日前推出 Ryzen(锐龙)嵌入式 8000 系列处理器,这是首款基于 AMD XDNA 架构的 NPU 与传统 CPU 和 GPU 元件相结合的 AMD 嵌入式器件,面向工业人工智能( AI )应用对工作负载多功能性和灵活应
    的头像 发表于 04-18 10:36 878次阅读

    电阻应变片形变量有多大?电阻应变片能承受的拉应变最大是多少?

    量可以通过计算材料的拉伸或压缩来确定。下面详细介绍电阻应变片的形变量及其计算方法。 首先,我们需要了解一些基本概念。应变是指物体在受到外力
    的头像 发表于 02-04 15:11 1579次阅读

    国产技术创新与实践分享|2024技术创新实践论坛精彩回顾来啦!

    1月19日下午,由中科驭数主办的第二届证券基金行业先进计算技术大会暨2024技术创新实践论坛(上海站)圆满落幕。本次论坛得到了中国计算机学会集成电路设计专委、中国电子工业标准化技
    的头像 发表于 01-20 11:40 1281次阅读

    fpga布局布线算法加速

    任务是逻辑元件与连接线路进行合理的布局和布线,以实现性能优化和电路连接的可靠性。然而,FPGA布局布线的过程通常是一项繁琐且耗时的任务,因此加速
    的头像 发表于 12-20 09:55 841次阅读