0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在数据量巨大的环境中,AI加速器等硬件系统占据舞台中心

新思科技 来源:新思科技 作者:新思科技 2021-04-02 09:33 次阅读

软件一直是智能应用领域的创新助推器,而硬件正迅速成为人工智能AI)领域的核心引擎。人脸识别、自动驾驶、虚拟辅助,以及众多其他应用都要依赖AI硬件。预计到2025年,AI的市场规模将达到650亿美元。

神经网络等并行计算系统对于能够处理海量数据并执行自我迭代训练有着巨大的需求,硬件也因此成为这一领域的主导力量。在这个数据量巨大的环境中,AI加速器等硬件系统占据了舞台中心

AI加速器具有如下众多优势:

● 能效相较于通用型计算设备显著提高

● 降低计算延迟以支持实时应用

● 具备可扩展性,能够取得性能速度改善,其程度甚至能与所用的内核数达成线性扩展

● 异构架构支持系统容纳多个专用处理器以执行特定任务

AI加速器支持数据中心和边缘

AI加速器主要在两大领域发挥作用:数据中心和边缘。现在的数据中心需要大规模的可拓展计算架构,尤其是那些可支持多达数千台物理服务器和数百万台虚拟机的超大规模数据中心,对大规模可扩展计算架构的需求极为迫切,这一市场需求使得一些企业凭借加速AI工作负载这一业务发展壮大。例如,Cerebras为Cerebras CS-1深度学习系统创造了晶圆级引擎(WSE)。WSE面积为46,225mm²,拥有1.2 万亿个晶体管和40万个经过AI优化的内核,是迄今为止最大的芯片。WSE可提供更大的算力、存储和通信带宽,能够支持AI研究达到前所未有的速度和规模。与之相对的是硬件基板面有限且节能至为关键的边缘应用。如果边缘SoC内部集成了AI加速器IP ,则它可以快速提供必要的智能功能从而支持各种应用,例如智能手机或自动化工厂机器人中运行的交互式程序。对于在边缘提供智能应用,支持它们的 AI加速器必须经过优化,以具备诸如实时计算延迟、超高能效、失效安全运行以及高度可靠性等特征。

并不是所有AI应用都需要像WSE这么大的芯片,例如以下类型的硬件AI加速器:

● 能够执行时间神经网络处理的图形处理单元 (GPU

● Google张量处理单元 (TPU) 等空间加速器

● Sambanova的DataScale等粗粒度可重构计算架构 (CGRA)

● 经过向量处理扩展的大规模多核标量处理器

所有此类芯片均可以几十个或几百个组合使用,形成更大的系统,处理更大型的神经网络。比如说,如果将Google的TPU合并到pod配置中,那么可以带来超过100 petaFLOPS的处理能力来训练神经网络模型。NVIDIA旗下应用深度学习研究团队推出的Megatron创造了一个带有83亿参数转换器的语言模型,可提供8路模型并行和64路数据并行功能用于自然语言处理。要执行这一模型,就必须开发出具有 312 teraFLOP FP16计算能力的NVIDIA A100 GPU。另一种新兴的硬件类型是 CGRA,它能在编程不同网络时,在性能、能效与灵活性方面巧妙地实现权衡。

在这场关于AI硬件的讨论中,软件栈是不容忽视的存在,因为它能实现系统级性能表现,并确保充分利用硬件。TensorFlow等开源软件平台为开发人员提供各类工具、库和其他资源,帮助他们轻松构建和部署机器学习应用。Facebook Glow等机器学习编译器不断涌现,有助于促成高级软件框架与各种AI加速器的连接。

种类全面的AI设计产品组合

硬件已经成为AI应用的关键组件,但此类组件仍然面临特有的设计难题,在云和边缘应用想要突破当前硅技术的功耗、性能和面积(PPA)极限时尤其如此。对数据中心来说,件设计呈现多级物理分层、局部同步和全局异步架构、尺寸庞大和布局分散等特征。在边缘应用中, AI设计必须能够处理数以百计的设计角,以满足超低功耗要求,实现异构集成并具备超乎寻常的多变性。

新思科技能够为AI硬件设计人员提供业内最为全面的AI设计产品组合,帮助他们攻克此类难题。我们的产品,以边缘设备IP、Zebu Server 4仿真系统,全面辐射整个范围,并能快速将载复杂的工作负载引入到Fusion Design Platform,实现全流程的、且经AI改进结果质量(QoR)和结果转化时间(TTR)的IC设计

新思科技还推出DSO.ai(设计空间优化AI),这是业内首款针对芯片设计的自主AI应用。DSO.ai 在非常大的芯片设计解决方案范围内寻找优化目标。它减少了设计工作流中自动执行的间接决策,从而大幅加快了专用AI加速器的设计进度。

随着AI应用更加深入地融入我们的生活,AI加速器等硬件将会继续发挥关键作用,实现实时响应,为智能设备和系统创造更大价值。

原文标题:AI加速器,实现人工智能创新的核心引擎

文章出处:【微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    795

    浏览量

    37741
  • AI
    AI
    +关注

    关注

    87

    文章

    30072

    浏览量

    268343
  • 人工智能
    +关注

    关注

    1791

    文章

    46820

    浏览量

    237463

原文标题:AI加速器,实现人工智能创新的核心引擎

文章出处:【微信号:Synopsys_CN,微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    PCIe加速卡在数据中心的应用

    随着数据中心的快速发展,对计算能力的需求也在不断增长。PCIe(Peripheral Component Interconnect Express)加速卡作为一种高性能的计算设备,已经在数据中心
    的头像 发表于 11-06 09:32 268次阅读

    适用于数据中心应用硬件加速器的直流/直流转换解决方案

    电子发烧友网站提供《适用于数据中心应用硬件加速器的直流/直流转换解决方案.pdf》资料免费下载
    发表于 08-26 09:38 0次下载
    适用于<b class='flag-5'>数据中心</b>应用<b class='flag-5'>中</b>的<b class='flag-5'>硬件加速器</b>的直流/直流转换<b class='flag-5'>器</b>解决方案

    下一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级AI更快的嵌入处理

    电子发烧友网站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级AI
    发表于 08-15 11:06 0次下载
    下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高级<b class='flag-5'>AI</b><b class='flag-5'>系统</b>高级<b class='flag-5'>AI</b><b class='flag-5'>中</b>更快的嵌入处理

    “白地板”方案,智算中心加速器

    明德源能白地板方案,智算中心加速器
    的头像 发表于 06-21 11:54 730次阅读

    西门子推出Catapult AI NN:重塑神经网络加速器设计的未来

    的需求,西门子数字化工业软件日前推出了一款名为Catapult AI NN的创新软件,旨在帮助神经网络加速器在专用集成电路(ASIC)和芯片级系统(SoC)上实现更高效的高层次综合(HLS)。
    的头像 发表于 06-19 16:40 662次阅读

    西门子推出Catapult AI NN软件,赋能神经网络加速器设计

    西门子数字化工业软件近日发布了Catapult AI NN软件,这款软件在神经网络加速器设计领域迈出了重要一步。Catapult AI NN软件专注于在专用集成电路(ASIC)和芯片级系统
    的头像 发表于 06-19 11:27 812次阅读

    八大科技巨头携手推进UALink,加速数据中心AI互联

    近日,英特尔、Google、微软、Meta八家科技巨头宣布共同成立超加速器链接(UALink)推广小组,致力于推动数据中心AI加速器芯片
    的头像 发表于 05-31 10:59 783次阅读

    美国限制向中东AI加速器出口,审查国家安全

    AI加速器能协助数据中心处理大量人工智能聊天机器人和其他工具的开发信息。如今,它们已然成为构建AI基础设施的企业和政府的必需品。
    的头像 发表于 05-31 09:20 526次阅读

    家居智能化,推动AI加速器的发展

    提高了系统的运算能力和数据处理能力,还为用户带来了更加智能化、个性化的生活体验。   AI 加速器的发展   在人工智能和机器学习任务变得日益复杂和密集之前,传统的CPU和GPU已经足
    的头像 发表于 02-23 00:18 4533次阅读

    回旋加速器原理 回旋加速器的影响因素

    回旋加速器(Cyclotron)是一种用于加速带电粒子的可再生粒子加速器。它的工作原理基于带电粒子在恒定强磁场的运动。本文将详细介绍回旋加速器
    的头像 发表于 01-30 10:02 3545次阅读

    数据处理器:DPU编程入门》读书笔记

    关注计算能力的提升,通信基础设施的提升跟不上,那么数据中心的整体系统性能依然受限,无法发挥出真正的潜力。DPU的提出背景就是应对这些数据量和复杂性的指数级增长。未来,需要将计算移至接近数据
    发表于 12-21 10:47

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一种重要的实验设备,用于研究粒子物理学、核物理学领域。其主要原理是通过电场和磁场的作用,对带电粒子进行
    的头像 发表于 12-18 13:52 1970次阅读

    英特尔Gaudi 3系列AI加速器明年上市

    英特尔总裁帕特·基辛格(Pat Gelsinger)认为,鉴于英特尔Gaudi3具备的持续加强的性能优势和极具竞争性的TCO及定价机制,预测该产品有望在2024年凭借领先的AI加速器套件占据更大的市场份额。
    的头像 发表于 12-15 11:07 763次阅读

    在CCES环境下如何使用21489的IIR加速器

    在VDSP++的环境下程序已经实现,但是到了CCES下,把中断初始化函数修改了,还是无法正确配置中断,直接返回IIR的中断初始化失败,请问CCES下怎么使用IIR加速器
    发表于 11-30 08:20

    21489的IIR加速器滤波参数设置如何对应加速器的滤波参数?

    目前在用21489内部的IIR加速器去做一个低通滤波,在例程的基础上修改参数。通过平板的fda 工具工具去设计参数,但是设计出来的参数不知道如何对应加速器的滤波参数,手册里也看得不是很明白。 设计的参数如下: 请问
    发表于 11-30 08:11