0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM 新款高能效 AI 芯片:能效比高过 NVIDIA A100

工程师邓生 来源:芯东西 作者:温淑 2021-02-19 11:03 次阅读

2 月 18 日报道,本届集成电路设计领域顶会 “国际固态电路会议(ISSCC 2021)”正在进行中(2021 年 2 月 13 日到 22 日)。作为已有近 70 年历史的集成电路产学届盛会,ISSCC 2021 亦被许多厂商视为发布其领先芯片技术的权威舞台。

本届会议上,IBM 发表了据称是 “全球首款”的高能效 AI 芯片,该芯片采用 7nm 制程工艺,可达到 80% 以上的训练利用率和 60% 以上的推理利用率,而通常情况下,GPU 的利用率在 30% 以下。

性能参数方面,IBM 新品的运算密度高于同样采用 7nm 工艺的 NVIDIA A100 GPU;其在多种精度下的整数运算性能,还优于联发科 7nm 专用 AI 芯片等产品

据 IBM 官网分享,其新款 7nm 高能效 AI 芯片该款芯片在多种场景中均有较好的应用前景,比如,可用于混合云环境中的低能耗 AI 训练、或用于实现更接近边缘的云端训练等。

一、IBM 新款高能效 AI 芯片:能效比高过 NVIDIA A100

对比结果显示,IBM 新款 7nm 高能效 AI 芯片的性能和能效,不同程度地超越了 IBM 此前推出的 14nm 芯片、韩国科学院(KAIST)推出的 65nm 芯片、阿里巴巴旗下芯片公司平头哥推出的 12nm 芯片含光 800、NVIDIA 推出的 7nm 芯片 A100、联发科推出的 7nm 芯片。

IBM 新款 7nm 高能效 AI 芯片支持 fp8、fp16、fp32、int4、int2 混合精度。

在 fp32 和 fp8 精度下,IBM 新款高能效 AI 芯片的每秒浮点运算次数,分别达到 16TFLOPS 和 25.6TFLOPS;运算密度分别为 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2;能效比分别为 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精度下,IBM 新款高能效 AI 芯片的运算密度分别为 3.27TOPS/mm^2 和 5.22TOPS/mm^2;能效比分别为 16.5TOPS/W 和 8.9TOPS/W。

对比之下,IBM 此前推出的 14nm 芯片在 fp32 和 fp8 精度下的每秒浮点运算次数,分别为 2TFLOPS 和 3TFLOPS;在在 fp32 精度下的能效比为 1.4TFLOPS/W。

另外,在 7nm 芯片阵营中,NVIDIA A100 GPU 在 fp16 精度下的能效比为 0.78TFLOPS/W,在 int4 精度下的能效比为 3.12TOPS/W,均低于 IBM 新款高能效 AI 芯片。

pIYBAGAvK12AaOpeAAFehISLSRQ350.jpg

▲ IBM 新款高能效 AI 芯片与同类产品的性能参数对比

二、采用 IBM 自研超低精度训练 / 推理设计

IBM 官网文章写道,其新款 AI 芯片之所以能够兼顾能效和性能,是因为该芯片支持超低精度混合 8 位浮点格式((HFP8,hybrid FP8)。这是 IBM 于 2019 年发布的一种高度优化设计,允许 AI 芯片在低精度下完成训练任务和不同 AI 模型的推理任务,同时避免任何质量损失。

据悉,目前 IBM 将超低精度混合 8 位浮点格式用于训练、超低精度混合 4 位浮点格式用于推理,并开发了数据通信协议,以提升多核心 AI 芯片上不同核心间的数据交换效率。

据 IBM 官网文章,自 2015 年起,该公司每年将芯片的功耗性能提升 2.5 倍。这背后,IBM 致力于实现算法、架构、软件堆栈等各方面的创新。

▲ IBM 在低精度 AI 训练、推理方面的研究历程

除了采用超低精度混合 8 位浮点格式外,IBM 新款高能效 AI 芯片添加了电源管理功能。IBM 研究显示,在同等功率的情况下,通过减缓计算阶段的功率消耗,可以最大限度地提升芯片性能。

结语:AI 发展对芯片能耗提出更高要求

随着智能化浪潮席卷各个领域,AI 模型的复杂性日趋提高。相应地,AI 应用的能源消耗水平亦水涨船高。这一背景下,如何最大限度提升能效,成为 AI 芯片设计玩家们面临的重要命题。

IBM 通过采用超低精度混合 8 位浮点格式和内置电源管理功能,为其新款 AI 芯片实现了业界领先的高能效。但是,这一芯片尚未实现规模化量产,仍有待市场检验。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    455

    文章

    50697

    浏览量

    423040
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1755

    浏览量

    74671
  • NVIDIA
    +关注

    关注

    14

    文章

    4978

    浏览量

    102969
  • AI
    AI
    +关注

    关注

    87

    文章

    30698

    浏览量

    268849
收藏 人收藏

    评论

    相关推荐

    安科瑞管理监测云平台

    管理监测云平台的主要内容包括以下几个方面: 制定科学的管理制度和标准; 建立完善的能源监测系统和数据分析平台; 推进节能技术和设备的研发和应用; 加强人员培训和管理,提
    的头像 发表于 12-18 14:52 54次阅读
    安科瑞<b class='flag-5'>能</b><b class='flag-5'>效</b>管理监测云平台

    Erp指令

    ErP指令EC244/2009、EC245/2009、EU1194/2012和标签指令EU874/2012已经实行多年,欧盟委员会在近3年通过参照不断改进的照明产品技术、环境和经济因素以及实际
    的头像 发表于 11-20 23:57 144次阅读
    Erp指令<b class='flag-5'>能</b><b class='flag-5'>效</b>

    直播预约 |开源芯片系列讲座第24期:SRAM存算一体:赋高能RISC-V计算

    鹭岛论坛开源芯片系列讲座第24期「SRAM存算一体:赋高能RISC-V计算」11月27日(周三)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目SRAM存算一体:
    的头像 发表于 11-16 01:10 172次阅读
    直播预约 |开源<b class='flag-5'>芯片</b>系列讲座第24期:SRAM存算一体:赋<b class='flag-5'>能</b><b class='flag-5'>高能</b><b class='flag-5'>效</b>RISC-V计算

    上海贝岭超小封装物联网监测芯片BL0971介绍

    为实现这些监测及应用需求,上海贝岭在之前的物联网监测芯片BL0972的基础上,针对直流充电桩的应用需求,推出了超小封装的BL0971交直流
    的头像 发表于 11-15 11:27 304次阅读
    上海贝岭超小封装物联网<b class='flag-5'>能</b><b class='flag-5'>效</b>监测<b class='flag-5'>芯片</b>BL0971介绍

    安森美推动数据中心革新

    随着数据中心为了满足人工智能(AI)计算的庞大处理需求而变得越来越耗电,提高能变得至关重要。与一般的搜索引擎请求相比,搭载AI的引擎需要消耗超过10倍的电力。加快功率半导体的创新以改
    的头像 发表于 11-14 09:41 206次阅读

    智慧水务综合管理系统-提高污水厂

    简婷 安科瑞电气股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水务管理平台 1平台概述 安科瑞电气具备从终端感知、边缘计算到管理平台的产品*态体系,Acrel
    的头像 发表于 10-21 14:14 181次阅读
    智慧水务综合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理系统-提高污水厂<b class='flag-5'>能</b><b class='flag-5'>效</b>

    使用TPS2116实现建筑自动化应用的高能

    电子发烧友网站提供《使用TPS2116实现建筑自动化应用的高能.pdf》资料免费下载
    发表于 09-25 11:12 0次下载
    使用TPS2116实现建筑自动化应用的<b class='flag-5'>高能</b><b class='flag-5'>效</b>

    此芯科技发布“此芯P1”异构高能芯片,引领AI PC新纪元

    近日,此芯科技集团有限公司(简称“此芯科技”)在上海隆重举办了AI PC战略发布会,正式揭晓了其首款创新力作——“此芯P1”异构高能芯片。这一里程碑式的发布,标志着国产
    的头像 发表于 08-01 17:42 842次阅读

    利用AI和加速计算提升天气预报效率和

    NVIDIA GPU 驱动的扩散模型助力下,生成式 AI 在各个领域实现新的应用,大大提升了效率。   当台湾气象员得以在一台机器上模拟台风的细节,他们深感其对预报任务
    的头像 发表于 06-07 15:06 532次阅读

    智慧水务管理平台-为污水处理的管理提供科学、精细的解决方案

    程瑜 安科瑞电气股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水务管理平台 1平台概述 安科瑞电气具备从终端感知、边缘计算到管理平台的产品*态体系,Acrel
    的头像 发表于 04-18 15:50 438次阅读
    智慧水务<b class='flag-5'>能</b><b class='flag-5'>效</b>管理平台-为污水处理的<b class='flag-5'>能</b><b class='flag-5'>效</b>管理提供科学、精细的解决方案

    英伟达H200和A100的区别

    英伟达H200和A100两款芯片在性能、架构、内存以及应用场景等多个方面存在显著的区别。
    的头像 发表于 03-07 16:23 3579次阅读

    华为GigaGreen创新发布,构筑5G-A时代极致体验、极致

    MWC 2024 | 华为GigaGreen创新发布,构筑5G-A时代极致体验、极致
    的头像 发表于 02-23 17:02 571次阅读
    华为GigaGreen创新发布,构筑5G-<b class='flag-5'>A</b>时代极致体验、极致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    解读六大科技巨头自研AI芯片进展,谁将领跑未来?

    在当前的AI发展浪潮中,NVIDIA无疑是AI算力的领跑者。其A100/H100系列芯片已获得全
    发表于 02-22 10:35 485次阅读
    解读六大科技巨头自研<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>进展,谁将领跑未来?

    DC电源模块的优化探索与应用

    DC电源模块的优化探索与应用是一项重要的研究领域。优化可以提高电源模块的功率转换效率,减少能源的浪费,降低电源模块的发热量,延长其使用寿命。以下是一些
    的头像 发表于 12-22 14:28 423次阅读
    DC电源模块的<b class='flag-5'>能</b><b class='flag-5'>效</b>优化探索与应用

    DC电源模块的优化探索与应用

    BOSHIDA DC电源模块的优化探索与应用 DC电源模块的优化探索与应用是一项重要的研究领域。
    的头像 发表于 12-22 11:16 427次阅读
    DC电源模块的<b class='flag-5'>能</b><b class='flag-5'>效</b>优化探索与应用