0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一块晶圆等于一颗芯片!全球最大WSE-2处理器发布!7nm,面积达826 mm2

E4Life 来源:电子发烧友网 作者:周凯扬 2021-04-23 09:00 次阅读

不知大家是否还记得去年英伟达发布的A100 GPU,作为V100推出三年后的又一大计算卡,其性能较V100提升了20倍,英伟达更是称其为最大的7nm芯片,面积达到826 mm2。而初创公司Cerebras则在近日发布了第二代Wafer Scale Engine(WSE-2)芯片,夺下了7nm下面积最大芯片的宝座。

WSE-2 芯片/ Cerebras


从2015年到2020年,全球在训练大型模型上的计算已经到了30万倍,AI的限制更像是运算能力的限制,而不单单只是应用和创意。验证一个猜想和训练一个新模型可能会花上数周乃至数月的时间,Cerebras的WSE-2旨在解决这些影响创新速度的问题。

一块晶圆 =一个芯片

WSE-2与A100面积大小对比 / Cerebras


WSE-2从上一代的16nm工艺替换为7nm,尽管面积不变,但新制程的密度优势使其晶体管数量翻倍,达到了26000亿,AI核心数更是增加至85万个。Cerebras是在参数简介上直接对标英伟达的A100,与826 mm2 的A100相比,46225 mm2的WSE-2是前者的56倍。WSE-2片上内存为40GB,是A100的千倍,内存带宽更是做到A100的上万倍。WSE内含85万个专为AI应用优化的稀疏线性代数计算(SLAC)核心,非常适合神经网络运算。

Cerebras也指出内存也是计算中重要的一环。就拿上面提到的A100来说,A100只有40MB的L2 cache,却有着40GB的HBM2内存,但这种图形处理器的缺点就在于这种显存往往是片外内存,而且速度太慢,延迟过高。而WSE-2的40GB内存则是均匀分布在AI核心上,且带宽可以达到20PB/s。

其实早在去年的HotChips大会上,Cerebras就已经透露过这个85万AI核的新处理器,但由于一些延误,他们没法及时在去年发布。Cerebras联合创始人Andrew Feldman在近期采访中提到,与客户合作了一年之后,他们汲取了一些经验教训,并将其整合进了新的AI核心中去,因此这一推迟很可能是由于对AI核心微架构的改进。

以往一个晶圆需要切割成多个芯片,经过封装后再作为处理器上市售卖。而Cerebras的解决方案是晶圆级集成技术,直接利用一个晶圆的最大面积来生产单一芯片,不过考虑到目前矩形芯片依然是效率最高的选择,自然不可能直接拿整个圆形晶圆来制造芯片,Cerebras也从一块晶圆中选取了最大的正方形。虽然从12英寸晶圆的面积来看,制造一个WSE-2只用到了2/3的面积,但与芯片的售价相比,哪怕这些边角料被浪费,损失也只是沧海一粟而已。要知道Cerebras卖给匹茨堡超算中心的两台基于WSE-1的系统,可是从中获利近500万美元。

基于WSE-2的AI计算平台

但更强大的芯片放在一个老旧的系统里并非一定能实现全部的性能,反而可能会凸显出原有系统的瓶颈,比如通信结构、芯片I/O、电源和散热等等。这就像是拿法拉利的引擎放在大众车里,也跑不出前者的速度一样。

CS-2散热系统 / Cerebras


基于WSE-2、Cerebras的系统以及软件平台,Cerebras也推出了新一代深度学习系统CS-2,来突破系统上的限制。这么强大的性能自然需要强大的供电,CS-2采用了9+3的冗余供电配置来驱动WSE-2。但这样的供电自然也面临着散热上的挑战,Cerebras在CS-2内部运用了一套水冷散热系统,用水冷来对WSE-2散热,再由风冷来降低水温。与此同时,CS-2的空间占用并不大,这个26英寸高的机器仅仅占用15U的机架空间,虽然大于英伟达的HGX A100系统,但考虑到性能的提升,这点空间占用还是可以接受的。

CS-2 系统/ Cerebras


据Cerebras透露,WSE-2和CS-2都将于今年第三季度推出,而CS-2的价格也将从CS-1的2到3百万美元涨到“几百万”美元的不具体数字。

小结

尽管Cerebras的WSE-2是一个性能怪兽,但它的应用面并没有A100那么广,更像是面向小众市场。就拿WSE-1的一些客户来说,多数在进行一些生物及医学研究,比如癌症治疗、药物发现等,且多用于超算中心与国家实验室,比如上面提到的匹茨堡超算中心和阿贡国家实验室。而英伟达的A100则可以用于各种AI和HPC应用,这也是Cerebras目前的解决方案没有突破的,但考虑到Cerebras的定位也不是为了做到全面覆盖,专注于一个市场反而是Cerebras能做到如此优秀的原因所在。

其实最值得去突破的仍是这种晶圆级集成的技术,固然芯片设计厂商希望从单一晶圆中获取更多的芯片,获取更高的利润,但这种纯粹追求性能的芯片反而适合如今不少Power-hungry的应用。话虽如此,实现这类芯片的良率同样是一大挑战,并不是每家公司都像Cerebras一样在WSE-2上实现100%的良率的。

本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19125

    浏览量

    228881
  • 芯片
    +关注

    关注

    453

    文章

    50277

    浏览量

    421211
收藏 人收藏

    评论

    相关推荐

    所谓的7nm芯片上没有个图形是7nm

    最近网上因为光刻机的事情,网上又是阵热闹。好多人又开始讨论起28nm/7nm的事情了有意无意之间,我也看了不少网上关于国产自主7nm工艺的文章。不过这些文章里更多是抒情和遐想,却很少
    的头像 发表于 10-08 17:12 190次阅读
    所谓的<b class='flag-5'>7nm</b><b class='flag-5'>芯片</b>上没有<b class='flag-5'>一</b>个图形是<b class='flag-5'>7nm</b>的

    基于全志V853处理器的智能辅助驾驶算法介绍

    全志V853处理器,是专为智慧视觉领域设计的AI处理器,配备了高效的NPU算力和丰富的外设接口,能够提供稳定的AI边缘计算支持;同时,基于V853处理器性能优势,全志还为客户提供了
    的头像 发表于 09-14 09:23 576次阅读
    基于全志V853<b class='flag-5'>处理器</b>的智能辅助驾驶算法介绍

    使用TPS6521815 PMIC为NXP i.MX 7处理器供电

    电子发烧友网站提供《使用TPS6521815 PMIC为NXP i.MX 7处理器供电.pdf》资料免费下载
    发表于 09-13 09:40 0次下载
    使用TPS6521815 PMIC为NXP i.MX <b class='flag-5'>7</b><b class='flag-5'>处理器</b>供电

    高通骁龙6 Gen 3处理器发布

    高通公司近日正式推出了骁龙6 Gen 3处理器,这款芯片采用先进的三星4nm工艺打造,代号为SM6475-AB,标志着中端处理器市场的新
    的头像 发表于 09-04 15:43 810次阅读

    广东龙芯发布2K0300蜂鸟板,今日正式发售

    的产品集成和灵活扩展。其中,核心板板载一颗LS2K0300处理器(内封一颗主频为1GHz的LS264处理器核心)、512MB的DDR4内存和
    发表于 06-20 10:00

    龙芯中科推出基于龙芯2K0300处理器的触控体机

    近日,中国自主芯片制造商龙芯中科成功发布了全新的触控体机,这款设备搭载了高性能的龙芯2K0300嵌入式处理器。该
    的头像 发表于 05-13 09:39 680次阅读

    一颗改变了世界的芯片

    英特尔突破性的8008微处理器于50多年前首次生产。这是英特尔的第个8位微处理器,也是您现在可能正在使用的x86处理器系列的祖先。我找不到8008的好的Die照片,所以我打开了
    的头像 发表于 04-20 08:10 838次阅读
    <b class='flag-5'>一颗</b>改变了世界的<b class='flag-5'>芯片</b>

    B200经面市,就只能做弟弟?Cerebras &apos;巨无霸&apos;能否逆袭成功?

    Cerebras Systems 发布全球最大芯片 WSE3 搭载4万亿个晶体管。与英伟 B2
    的头像 发表于 04-09 10:46 314次阅读
    B200<b class='flag-5'>一</b>经面市,就只能做弟弟?Cerebras &apos;巨无霸&apos;能否逆袭成功?

    瑞萨电子宣布推出基于Arm Cortex-M23处理器的RA2A2微控制产品群

    全球半导体解决方案供应商瑞萨电子(TSE:6723)今日宣布推出基于Arm Cortex-M23处理器的RA2A2微控制(MCU)产品群。
    的头像 发表于 03-22 10:57 646次阅读
    瑞萨电子宣布推出基于Arm Cortex-M23<b class='flag-5'>处理器</b>的RA<b class='flag-5'>2A2</b>微控制<b class='flag-5'>器</b>产品群

    世界第AI芯片发布!世界纪录直接翻倍 晶体管4万亿个

    3月14日消息,今天,美国芯片初创公司Cerebras Systems,推出了全球最强的第三代级AI加速芯片
    的头像 发表于 03-21 17:34 533次阅读

    Cerebras发布WSE-3 AI芯片,性能翻倍4万亿晶体,能耗不变

    该款 WSE-3 AI芯片几乎完全由一块12英寸构成,形如边长21.5厘米之正方体。这款芯片
    的头像 发表于 03-18 16:37 842次阅读

    2024年全球与中国7nm智能座舱芯片行业总体规模、主要企业国内外市场占有率及排名

    影响因素 1.5.4 进入行业壁垒 **2 **国内外市场占有率及排名 2.1 全球市场,近三年7nm智能座舱芯片主要企业占有率及排名(按销量) 2.1.1 近三年
    发表于 03-16 14:52

    M3芯片和i7处理器的区别

    M3芯片与i7处理器在多个方面存在显著差异。
    的头像 发表于 03-11 16:41 3443次阅读

    加Nord N30 SE 5G发布,搭载天玑6020处理器

    加官网站透露,Nord N30 SE 5G 将配备一块面积 6.72 英寸的高清 LCD 显示屏,搭载联发科天玑 6020 处理器、4
    的头像 发表于 01-30 11:50 1144次阅读

    文详解芯片7nm工艺

    芯片7nm工艺我们经常能听到,但是7nm是否真的意味着芯片的尺寸只有7nm呢?让我们起来看看
    的头像 发表于 12-07 11:45 5267次阅读
    <b class='flag-5'>一</b>文详解<b class='flag-5'>芯片</b>的<b class='flag-5'>7nm</b>工艺