0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美国正在开发用于图处理的下一代ASIC

我快闭嘴 来源:半导体行业观察 作者:David Schor 2020-09-28 15:52 次阅读

现代微处理器通常能够通过分层缓存来隐藏计算与内存之间的大部分差距。这是因为许多负载表现出相对可预测的一般内存模式,可以通过空间局部性和时间局部性加以利用。有些负载还尴尬地并行。例如,人工智能负载往往表现出这种行为。只要你持续为机器提供数据,更多计算就相当于更高性能。人工智能负载往往具有非常可预测的内存模式以及较高的数据重新利用能力,这有助于实现上述所有目标。

不幸的是,并非所有算法都具有这些理想的特性。图就是这样一个例子。企业广泛地使用图来处理大数据。这些数据结构往往有上万亿个边缘,并采用特殊的图算法对数据进行操作。图算法采用非常随机的内存访问模式,导致负载受到内存延迟的高度限制,迫使计算元素在很多时候陷入停滞。它本质上是一个非常大的指针追逐问题,表现出与运行在GPUCPU上的大多数负载相矛盾的行为。

更糟的是,图算法往往具有非常差的次线性缩放特性。你根本无法通过投入更多处理器来解决这个问题。由于数据的稀疏性和不规则性,下一个数据访问通常是在一个完全不同的节点上,传输数据最终会导致整个系统出现瓶颈。

美国国防部分层识别验证及利用计划(DARPA HIVE)

分层识别验证及利用(HIVE)计划是美国国防部正在开展的一项计划,目标是解决这些缺点。HIVE采用软硬件双管齐下的方式。针对该计划的硬件部分,正在开发用于图处理的下一代ASIC。针对软件部分,正在开发一个新的全栈图框架。美国国防部希望通过专门的图处理器和优化的软件栈,实现比当前同类最佳的GPU高1000倍的性能效率。

在上个月底举行的DARPA ERI峰会上,Peter Wang介绍了该项目的最新进展。Wang是Anaconda公司的联合创始人兼首席技术官。他也是HIVE软件架构的首席研究员。

介绍英特尔PUMA团队

英特尔负责HIVE的硬件架构部分,他们正在开发一个新的架构来解决这些问题。在英特尔的数据中心事业部内部有一个名为PUMA的秘密团队。他们负责图分析(GA)处理器的开发。这是他们正在秘密开发的一个完整产品,英特尔打算最终将其商业化。

新的图处理器基于一种新开发的架构,被称为可编程统一内存架构或PUMA。这是一种新的架构,用于整个全局统一内存空间的小型不规则内存访问。在这种架构下,芯片放弃了现代CPU和GPU所使用的许多基本假设——它并不假设自己拥有附近所有内存,它并不假设内存访问会在不久的将来重复执行,它也不假设对特定地址的内存访问意味着附近的内存地址也将被访问。Wong说:“通过抛弃这些基本假设,你可以围绕对全局统一数据的小访问而构建一个完全不同的硬件架构。然后,在每个阶段,每当有一个有线互联或者任何把一个计算单元连接到其它一些数据单元或其它计算单元的东西,每一个点都针对延迟进了优化。” PUMA从根本上改变了与内存访问相关的行为,使内存访问更小、更有效,并使访问这些内存的延迟更长,但在整个系统中实现扁平化。

PUMA实现机箱级完全集成,可以跨处理元件和内存进行良好的通信。它旨在扩展到大型系统,在多个机架和多个集群上使用。

Wang根据英特尔的内部模拟结果给出了一些初步性能数据。他说:“节点缩放确实是一个关键问题。当我们讨论上万亿个边缘的时候,我们知道这些数字会变得更大。”为此,Wang报告了超过80%的缩放效率。他补充道:“这实际上让我们能够并行化解决图问题的方法。”

软件基础设施

HIVE的第二阶段是构建软件基础设施。新软件不仅必须与新硬件兼容,而且必须与现有CPU和GPU兼容。此外,新软件必须支持数据科学届使用的大量现有软件。现有的大量软件都是为了以某种方式解决特定的图问题而开发的。该计划的部分目标是能够将现有的软件和库连接到HIVE软件框架中,以便使其更易于投入使用。

当前的软件包括通过API公开的算法、数据的内部图表示以及硬件后端(GPU、CPU、FPGA或ASIC)。Wang解释说,在当前平台下,必须做出重大取舍,无论是针对某种类型的硬件进行优化还是针对某些算法进行优化。Wang说: “如果你专门从事图表示,那么你就会与数据科学生态系统脱节,因为你被切断了与一些重要库的联系。”

作为HIVE第二阶段一部分,他们正在开发模块化架构框架。现有软件正在重新纳入它们的组成部分,以便可以根据该软件最佳功能将其插入到框架中。该结构包括Workflow Scheduler和Dispatch Engine,用于把User API负载任务路由到后端。他们利用DASK任务调度程序来执行此操作。这也是他们进行后端切换和调度的方式。顺便说一句,值得注意的是,虽然他们正在与英特尔密切合作,共同开发这个框架,以便能够通过PUMA架构实现其性能目标,但是软件框架并不是专门为PUMA设计的。事实上,它们完全针对广泛的硬件,以便数据科学家立即能够跨越CPU、GPU和FPGA,充分利用相同的软件基础设施。并最终使用相同的基础架构,利用PUMA图处理器来加速相同的负载。

值得一提的是,如果有必要,在后端,框架可包含一组能够转换不同格式数据的转换器

这种设计有两大好处——集成新硬件意味着设计了一个新的硬件后端,如果数据模型与现有模型不同,则添加对数据模型的支持,并添加一个可以从现有数据模型转换到新数据模型的转换器。同样,集成一个新的User API只需要在其中一个硬件上添加一个接口并至少采用一种算法。

最终,HIVE的总体目标就是统一和简化“让图软件与硬件进行优化通信的”流程,只需让硬件厂商提供其硬件并为其集成一个良好的后端,同时让数据科学家能够通过自己的API和算法来充分利用该硬件。

Wang透露,从明年开始,用户有望看到开源的初始源代码。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1625

    文章

    21650

    浏览量

    601493
  • asic
    +关注

    关注

    34

    文章

    1184

    浏览量

    120278
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10816

    浏览量

    210990
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4686

    浏览量

    128652
  • 微处理器
    +关注

    关注

    11

    文章

    2246

    浏览量

    82287
收藏 人收藏

    评论

    相关推荐

    意法半导体下一代汽车微控制器的战略部署

    ‍‍‍‍‍‍‍‍ 意法半导体致力于帮助汽车行业应对电气化和数字化的挑战,不仅提供现阶段所需的解决方案,未来还提供更强大的统的MCU平台开发战略,通过突破性创新支持下一代车辆架构和软件定义
    的头像 发表于 11-07 14:09 204次阅读

    实现下一代具有电压电平转换功能的处理器、FPGA 和ASSP

    电子发烧友网站提供《实现下一代具有电压电平转换功能的处理器、FPGA 和ASSP.pdf》资料免费下载
    发表于 09-09 09:46 0次下载
    实现<b class='flag-5'>下一代</b>具有电压电平转换功能的<b class='flag-5'>处理</b>器、FPGA 和ASSP

    ASMPT与美光携手开发下一代HBM4键合设备

    在半导体制造技术的持续演进中,韩国后端设备制造商ASMPT与全球知名的内存解决方案提供商美光公司近日宣布了项重要的合作。据悉,ASMPT已向美光提供了专用于高带宽内存(HBM)生产的演示热压(TC)键合机,双方将携手开发下一代
    的头像 发表于 07-01 11:04 754次阅读

    24芯M16插头在下一代技术中的潜力

      德索工程师说道随着科技的飞速发展,下一代技术正逐渐展现出其独特的魅力和潜力。在这背景下,24芯M16插头作为种高性能、多功能的连接器,将在下一代技术中发挥至关重要的作用。以下是
    的头像 发表于 06-15 18:03 289次阅读
    24芯M16插头在<b class='flag-5'>下一代</b>技术中的潜力

    赛轮思与NVIDIA合作,利用生成式AI打造下一代车内体验

    AI 驱动的移动出行创新企业与 NVIDIA 合作,打造下一代车内体验。
    的头像 发表于 05-23 10:12 1203次阅读

    丰田、日产和本田将合作开发下一代汽车的AI和芯片

    丰田、日产和本田等日本主要汽车制造商确实计划联手开发下一代汽车的软件,包括在生成式人工智能(AI)和半导体(芯片)等领域进行合作。
    的头像 发表于 05-20 10:25 931次阅读

    日本车企联手开发下一代汽车软件

    丰田、日产、本田等日本汽车制造商宣布将共同开发下一代汽车软件,结合各自在AI和半导体领域的优势。随着汽车行业数字化转型的推进,日本经济产业省即将公布的发展路线图强调了汽车制造商间的合作重要性,尤其聚焦在软件定义汽车(SDV)上。
    的头像 发表于 05-17 11:14 520次阅读

    浅谈下一代HMI的三个考虑因素

    步入人机交互的新世界,将需要交互式的智能应用,同时,用于支持实现 HMI 的处理器也面临系列新的挑战。下面,我们来详细了解下一代 HMI 的三个考虑因素。
    发表于 04-19 11:15 213次阅读

    使用NVIDIA Holoscan for Media构建下一代直播媒体应用

    NVIDIA Holoscan for Media 现已向所有希望在完全可重复使用的集群上构建下一代直播媒体应用的开发者开放。
    的头像 发表于 04-16 14:04 588次阅读

    三星电子在硅谷设立新实验室,开发下一代3D DRAM芯片

    三星电子近日宣布,已在美国硅谷开设个新的研发(R&D)实验室,专注于下一代3D DRAM芯片的开发。这新实验室将由三星的Device S
    的头像 发表于 01-29 11:29 823次阅读

    TDK和固特异合作推动下一代轮胎解决方案

    TDK 株式会社(TES:6762)和固特异轮胎橡胶公司(NASDAQ:GT)今日宣布将合作推动下一代轮胎解决方案,旨在加快轮胎和汽车生态系统中集成智能硬件和软件的开发和采用。
    的头像 发表于 01-10 13:33 558次阅读

    有奖问卷 | 下一代开发工具,由你定义!

    我们正在进行项关于下一代开发者体验的研究,旨在深入了解和优化未来的开发工作流程和工具。在全部数据回收后, 将抽取
    的头像 发表于 12-15 15:50 389次阅读

    用于下一代大功率应用的XHP™2封装

    用于下一代大功率应用的XHP™2封装
    的头像 发表于 11-29 17:04 941次阅读
    适<b class='flag-5'>用于</b><b class='flag-5'>下一代</b>大功率应用的XHP™2封装

    媒体聚焦 | ​RENSAS瑞萨公开下一代车用处理器蓝图,全面拥抱平台化

    媒体聚焦 | ​RENSAS瑞萨公开下一代车用处理器蓝图,全面拥抱平台化
    的头像 发表于 11-28 13:34 540次阅读
    媒体聚焦 | ​RENSAS瑞萨公开<b class='flag-5'>下一代</b>车用<b class='flag-5'>处理</b>器蓝图,全面拥抱平台化

    如何保障下一代碳化硅 (SiC) 器件的供需平衡

    如何保障下一代碳化硅 (SiC) 器件的供需平衡
    的头像 发表于 11-23 17:00 374次阅读
    如何保障<b class='flag-5'>下一代</b>碳化硅 (SiC) 器件的供需平衡