0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Cerebras:CS-1的速度比Joule超级计算机快200倍

我快闭嘴 来源:半导体行业观察 作者:半导体行业观察 2020-11-18 12:52 次阅读

Cerebras Systems和联邦能源部国家能源技术实验室今天宣布,该公司的CS-1系统比图形处理单元(GPU)快10,000倍。

换而言之,这意味着以前需要花费数月时间进行训练的AI神经网络,现在在Cerebras系统上仅需要进行数分钟的训练,就能完成。

Cerebras生产世界上最大的计算机芯片WSE。芯片制造商通常会从直径12英寸的硅锭中切出晶圆,然后在芯片工厂中进行处理。处理完成后,将晶片切成数百个可用于电子硬件的独立芯片。

但是由SeaMicro创始人Andrew Feldman创立的Cerebras用整个晶圆制造出了一块巨大的芯片。芯片的每个部分都称为核心,以复杂的方式互连到其他核心。互连设计为使所有内核保持高速运行,因此晶体管可以一起工作。

Cerebras的CS-1系统使用WSE硅片大小的芯片,该芯片具有1.2万亿个晶体管,这些基本的开关电子开关是硅芯片的基础。英特尔1971年的第一个4004处理器具有2,300个晶体管,而昨天宣布的Nvidia A100 80GB芯片具有540亿个晶体管。

Feldman在接受VentureBeat采访时说,CS-1的速度也比Joule超级计算机快200倍,后者在全球500强超级计算机中名列第82位。

Feldman说:“它显示了创纪录的性能。这也表明晶圆级技术的应用范围超出了AI。”

这些数据是总部位于加利福尼亚州的Cerebras采用激进方法得出的成果,该方法创建了具有40万个AI核的芯片,而不是将该晶片切成单个芯片。Feldman说,这种不寻常的设计使完成任务变得容易得多,因为处理器和内存彼此靠近,并且有很多带宽可以连接它们。该方法在不同的计算任务中适用范围的问题仍然存在。

根据Cerebras与联邦实验室合作的结果发表的一篇论文说,CS-1可以提供任何数量的中央处理器(CPU)和GPU都无法达到的性能,而中央处理器和GPU都是超级计算机中常用的。(现在70%的顶级超级计算机都使用了英伟达的GPU )。Feldman补充说,“不管超级计算机有多大,这都是真的。”

Cerebras将在本周的SC20超级计算在线活动中进行演示。CS-1在计算流体动力学方面的工作量击败了Joule 超级计算机,它可以模拟化油器等地方的流体运动。Joule 超级计算机的建造成本为数千万美元,其中有84,000个CPU内核分布在数十个机架上,消耗的功率为450千瓦。

根据能源实验室主管Brian Anderson的说法,在此演示中,Joule 超级计算机使用了16,384个内核,而Cerebras计算机的速度提高了200倍。Cerebras花费数百万美元,并使用20千瓦的功率。

“对于这些工作量,晶圆级CS-1是有史以来最快的机器,”Feldman说。“而且它比其他处理器的任何其他组合或集群都快。”

单个Cerebras CS-1的高度为26英寸,可占据三分之一的机架,并由业界唯一的晶圆级处理引擎Cerebras的WSE提供动力。它结合了内存性能与大带宽,低延迟的处理器间通信以及针对高带宽计算进行了优化的体系结构。

该研究由NETL机器学习和数据科学工程师Dirk Van Essendelft以及Cerebras联合创始人兼高级技术首席架构师Michael James领导。经过几个月的努力,结果才出现。

2019年9月,能源部宣布与Cerebras建立合作伙伴关系,其中包括与Argonne国家实验室和Lawrence Livermore国家实验室的部署。

Cerebras CS-1于2019年11月发布。CS-1是围绕WSE构建的,它的体积是WSE的56倍,内核增加了54倍,片上内存增加了450倍,内存带宽增加了5788倍,并且20,833倍Cerebras说,与领先的GPU竞争对手相比,其结构带宽更大。

费尔德曼指出,CS-1可以比实时完成更快的计算,这意味着它可以在反应开始时启动电厂反应堆核心的仿真,并在反应结束之前完成仿真。

“这些动态建模问题具有有趣的特征,”Feldman说。“它们在CPU和GPU内核之间的伸缩性很差。用计算科学家的语言来说,它们没有表现出“强扩展性”。这意味着,在一定程度上,向超级计算机添加更多处理器不会带来额外的性能提升。”

Cerebras已经筹集了4.5亿美元,拥有275名员工。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19125

    浏览量

    228881
  • 芯片
    +关注

    关注

    453

    文章

    50277

    浏览量

    421208
  • 计算机
    +关注

    关注

    19

    文章

    7386

    浏览量

    87646
  • 晶体管
    +关注

    关注

    77

    文章

    9614

    浏览量

    137703
收藏 人收藏

    评论

    相关推荐

    丹麦推出首台AI超级计算机Gefion

    高效互连,确保了卓越的计算能力和数据传输速度。 该超级计算机位于丹麦首都哥本哈根,旨在推动量子计算、清洁
    的头像 发表于 10-29 15:13 325次阅读

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机
    的头像 发表于 10-27 09:42 362次阅读

    云端超级计算机怎么用

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的
    的头像 发表于 10-18 10:14 91次阅读

    借助NVIDIA超级计算机加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 478次阅读

    AI初出企业Cerebras已申请IPO!称发布的AI芯片GPU更适合大模型训练

    美国加州,专注于研发GPU更适用于训练AI模型的晶圆级芯片,为复杂的AI应用构建计算机系统,并与阿布扎比科技集团G42等机构合作构建超级计算机。基于其最新旗舰芯片构建的服务器可轻松高
    的头像 发表于 06-26 00:09 2866次阅读
    AI初出企业<b class='flag-5'>Cerebras</b>已申请IPO!称发布的AI芯片<b class='flag-5'>比</b>GPU更适合大模型训练

    工业计算机与普通计算机的区别

    在信息化和自动化日益发展的今天,计算机已经成为了我们日常生活和工作中不可或缺的工具。然而,在计算机领域中,工业计算机和普通计算机虽然都具备基本的计算
    的头像 发表于 06-06 16:45 1131次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    30 ,能源效率提高了 25 。这些提升使得它能够更快地处理大规模的人工智能任务,加速模型的训练和推理过程。 **2. **超级计算机 英伟达推出的 DGX GB
    发表于 05-13 17:16

    富士通使用富岳超级计算机训练LLM

    尽管富士通的富岳超级计算机不再是超级计算机500强名单中最快的机器,但它仍然是一个非常强大的系统,A64FX处理器的多功能性允许将其用于各种工作负载,例如AI。
    的头像 发表于 05-13 14:18 506次阅读

    英伟达帮助日本建造混合量子超级计算机

    英伟达正在帮助日本建造混合量子超级计算机,这是日本国家量子计算计划的一部分。
    的头像 发表于 04-23 14:54 504次阅读

    微软和OpenAI计划投资1000亿美元建造“星际之门”AI超级计算机

    微软和OpenAI计划投资1000亿美元建造“星际之门”AI超级计算机这一消息属实。
    的头像 发表于 04-11 10:14 489次阅读

    从原子到超级计算机:NVIDIA与合作伙伴扩展量子计算应用

    量子计算领域的最新进展包括分子研究、部署巨型超级计算机,以及通过一项新的学术计划培养量子从业人员。
    的头像 发表于 03-22 10:05 381次阅读

    诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

    诺和诺德基金会携手英伟达,共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与创新,为丹麦乃至全球的诺和诺德基金会携手英伟
    的头像 发表于 03-21 13:43 538次阅读

    【量子计算机重构未来 | 阅读体验】第二章关键知识点

    量子计算机所能做的,刚好是减少计算和操作的繁琐程度。也就是说,量子计算机是因为计算过程简化而速度快
    发表于 03-06 23:17

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    话对我触动很大:量子计算机不仅能解决身边的问题,还能解决社会层面的重大课题。 看来真是“天下武功,唯不破”,只要处理速度足够快,海量数据处理就像计算
    发表于 03-05 17:37

    特斯拉在布法罗超级工厂投资5亿美元建造Dojo超级计算机

    霍楚尔表示,此次项目投资为5亿美元,并将同时在纽约州立大学建设另一台独立的AI超级计算机。“我很荣幸地告诉大家,特斯拉将在布法罗投资5亿美元,用于其新一代超级计算机的建设”,她说道。
    的头像 发表于 01-29 10:58 377次阅读