0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM 新款高能效 AI 芯片:能效比高过 NVIDIA A100

工程师邓生 来源:芯东西 作者:温淑 2021-02-19 11:03 次阅读

2 月 18 日报道,本届集成电路设计领域顶会 “国际固态电路会议(ISSCC 2021)”正在进行中(2021 年 2 月 13 日到 22 日)。作为已有近 70 年历史的集成电路产学届盛会,ISSCC 2021 亦被许多厂商视为发布其领先芯片技术的权威舞台。

本届会议上,IBM 发表了据称是 “全球首款”的高能效 AI 芯片,该芯片采用 7nm 制程工艺,可达到 80% 以上的训练利用率和 60% 以上的推理利用率,而通常情况下,GPU 的利用率在 30% 以下。

性能参数方面,IBM 新品的运算密度高于同样采用 7nm 工艺的 NVIDIA A100 GPU;其在多种精度下的整数运算性能,还优于联发科 7nm 专用 AI 芯片等产品

据 IBM 官网分享,其新款 7nm 高能效 AI 芯片该款芯片在多种场景中均有较好的应用前景,比如,可用于混合云环境中的低能耗 AI 训练、或用于实现更接近边缘的云端训练等。

一、IBM 新款高能效 AI 芯片:能效比高过 NVIDIA A100

对比结果显示,IBM 新款 7nm 高能效 AI 芯片的性能和能效,不同程度地超越了 IBM 此前推出的 14nm 芯片、韩国科学院(KAIST)推出的 65nm 芯片、阿里巴巴旗下芯片公司平头哥推出的 12nm 芯片含光 800、NVIDIA 推出的 7nm 芯片 A100、联发科推出的 7nm 芯片。

IBM 新款 7nm 高能效 AI 芯片支持 fp8、fp16、fp32、int4、int2 混合精度。

在 fp32 和 fp8 精度下,IBM 新款高能效 AI 芯片的每秒浮点运算次数,分别达到 16TFLOPS 和 25.6TFLOPS;运算密度分别为 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2;能效比分别为 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精度下,IBM 新款高能效 AI 芯片的运算密度分别为 3.27TOPS/mm^2 和 5.22TOPS/mm^2;能效比分别为 16.5TOPS/W 和 8.9TOPS/W。

对比之下,IBM 此前推出的 14nm 芯片在 fp32 和 fp8 精度下的每秒浮点运算次数,分别为 2TFLOPS 和 3TFLOPS;在在 fp32 精度下的能效比为 1.4TFLOPS/W。

另外,在 7nm 芯片阵营中,NVIDIA A100 GPU 在 fp16 精度下的能效比为 0.78TFLOPS/W,在 int4 精度下的能效比为 3.12TOPS/W,均低于 IBM 新款高能效 AI 芯片。

pIYBAGAvK12AaOpeAAFehISLSRQ350.jpg

▲ IBM 新款高能效 AI 芯片与同类产品的性能参数对比

二、采用 IBM 自研超低精度训练 / 推理设计

IBM 官网文章写道,其新款 AI 芯片之所以能够兼顾能效和性能,是因为该芯片支持超低精度混合 8 位浮点格式((HFP8,hybrid FP8)。这是 IBM 于 2019 年发布的一种高度优化设计,允许 AI 芯片在低精度下完成训练任务和不同 AI 模型的推理任务,同时避免任何质量损失。

据悉,目前 IBM 将超低精度混合 8 位浮点格式用于训练、超低精度混合 4 位浮点格式用于推理,并开发了数据通信协议,以提升多核心 AI 芯片上不同核心间的数据交换效率。

据 IBM 官网文章,自 2015 年起,该公司每年将芯片的功耗性能提升 2.5 倍。这背后,IBM 致力于实现算法、架构、软件堆栈等各方面的创新。

▲ IBM 在低精度 AI 训练、推理方面的研究历程

除了采用超低精度混合 8 位浮点格式外,IBM 新款高能效 AI 芯片添加了电源管理功能。IBM 研究显示,在同等功率的情况下,通过减缓计算阶段的功率消耗,可以最大限度地提升芯片性能。

结语:AI 发展对芯片能耗提出更高要求

随着智能化浪潮席卷各个领域,AI 模型的复杂性日趋提高。相应地,AI 应用的能源消耗水平亦水涨船高。这一背景下,如何最大限度提升能效,成为 AI 芯片设计玩家们面临的重要命题。

IBM 通过采用超低精度混合 8 位浮点格式和内置电源管理功能,为其新款 AI 芯片实现了业界领先的高能效。但是,这一芯片尚未实现规模化量产,仍有待市场检验。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    453

    文章

    50305

    浏览量

    421438
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1744

    浏览量

    74604
  • NVIDIA
    +关注

    关注

    14

    文章

    4863

    浏览量

    102755
  • AI
    AI
    +关注

    关注

    87

    文章

    29946

    浏览量

    268246
收藏 人收藏

    评论

    相关推荐

    上海贝岭超小封装物联网监测芯片BL0971介绍

    为实现这些监测及应用需求,上海贝岭在之前的物联网监测芯片BL0972的基础上,针对直流充电桩的应用需求,推出了超小封装的BL0971交直流
    的头像 发表于 11-15 11:27 128次阅读
    上海贝岭超小封装物联网<b class='flag-5'>能</b><b class='flag-5'>效</b>监测<b class='flag-5'>芯片</b>BL0971介绍

    安森美推动数据中心革新

    随着数据中心为了满足人工智能(AI)计算的庞大处理需求而变得越来越耗电,提高能变得至关重要。与一般的搜索引擎请求相比,搭载AI的引擎需要消耗超过10倍的电力。加快功率半导体的创新以改
    的头像 发表于 11-14 09:41 105次阅读

    智慧水务综合管理系统-提高污水厂

    简婷 安科瑞电气股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水务管理平台 1平台概述 安科瑞电气具备从终端感知、边缘计算到管理平台的产品*态体系,Acrel
    的头像 发表于 10-21 14:14 140次阅读
    智慧水务综合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理系统-提高污水厂<b class='flag-5'>能</b><b class='flag-5'>效</b>

    联发科天玑9400发布:比与端侧AI引领移动芯片行业革新

    AI大模型的推动下,智能手机市场的高端化进程进一步加速,旗舰机型的竞争已不再单纯依赖于“大力飞砖”式的极限性能比拼,而是更加注重综合素质的提升。特别是在手机芯片领域,高性能与低功耗、高能
    的头像 发表于 10-12 15:56 518次阅读

    使用TPS2116实现建筑自动化应用的高能

    电子发烧友网站提供《使用TPS2116实现建筑自动化应用的高能.pdf》资料免费下载
    发表于 09-25 11:12 0次下载
    使用TPS2116实现建筑自动化应用的<b class='flag-5'>高能</b><b class='flag-5'>效</b>

    此芯科技发布“此芯P1”异构高能芯片,引领AI PC新纪元

    近日,此芯科技集团有限公司(简称“此芯科技”)在上海隆重举办了AI PC战略发布会,正式揭晓了其首款创新力作——“此芯P1”异构高能芯片。这一里程碑式的发布,标志着国产
    的头像 发表于 08-01 17:42 778次阅读

    利用AI和加速计算提升天气预报效率和

    NVIDIA GPU 驱动的扩散模型助力下,生成式 AI 在各个领域实现新的应用,大大提升了效率。   当台湾气象员得以在一台机器上模拟台风的细节,他们深感其对预报任务
    的头像 发表于 06-07 15:06 485次阅读

    智慧水务管理平台-为污水处理的管理提供科学、精细的解决方案

    程瑜 安科瑞电气股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水务管理平台 1平台概述 安科瑞电气具备从终端感知、边缘计算到管理平台的产品*态体系,Acrel
    的头像 发表于 04-18 15:50 413次阅读
    智慧水务<b class='flag-5'>能</b><b class='flag-5'>效</b>管理平台-为污水处理的<b class='flag-5'>能</b><b class='flag-5'>效</b>管理提供科学、精细的解决方案

    英伟达H200和A100的区别

    英伟达H200和A100两款芯片在性能、架构、内存以及应用场景等多个方面存在显著的区别。
    的头像 发表于 03-07 16:23 3329次阅读

    华为GigaGreen创新发布,构筑5G-A时代极致体验、极致

    MWC 2024 | 华为GigaGreen创新发布,构筑5G-A时代极致体验、极致
    的头像 发表于 02-23 17:02 545次阅读
    华为GigaGreen创新发布,构筑5G-<b class='flag-5'>A</b>时代极致体验、极致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    解读六大科技巨头自研AI芯片进展,谁将领跑未来?

    在当前的AI发展浪潮中,NVIDIA无疑是AI算力的领跑者。其A100/H100系列芯片已获得全
    发表于 02-22 10:35 440次阅读
    解读六大科技巨头自研<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>进展,谁将领跑未来?

    以节能为导向,笙泉BLDC硬件演算提高能

    电子发烧友网报道(文/李宁远)随着高能电机在各领域的广泛使用,全球的电机市场得到了很大的增长。以BLDC为代表的高能电机正在各类应用领域取代传统低能
    的头像 发表于 01-09 00:06 1524次阅读

    NVIDIA特供中国的芯片AI性能大降10%售价依然高

    目前NVIDIA最昂贵的A100、H100芯片无法对中国市场出售,此前为中国市场定制的A800、H800
    的头像 发表于 01-03 16:07 1272次阅读

    DC电源模块的优化探索与应用

    DC电源模块的优化探索与应用是一项重要的研究领域。优化可以提高电源模块的功率转换效率,减少能源的浪费,降低电源模块的发热量,延长其使用寿命。以下是一些
    的头像 发表于 12-22 14:28 406次阅读
    DC电源模块的<b class='flag-5'>能</b><b class='flag-5'>效</b>优化探索与应用

    DC电源模块的优化探索与应用

    BOSHIDA DC电源模块的优化探索与应用 DC电源模块的优化探索与应用是一项重要的研究领域。
    的头像 发表于 12-22 11:16 405次阅读
    DC电源模块的<b class='flag-5'>能</b><b class='flag-5'>效</b>优化探索与应用