中国最大的计算芯片诞生！燧原科技发布邃思2.0 AI训练芯片-电子发烧友网

燧原科技于7月7日在上海发布第二代人工智能训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组，全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”，成为国内首家发布第二代人工智能训练产品组合的公司。

这是继2019年12年发布第一代训练芯片，邃思1.0及云燧T10/T11，2020年12月发布第一代推理产品云燧i10之后，燧原科技的又一力作。

燧原科技CEO赵立东（左）与燧原科技COO张亚林（右）共同发布“云燧T20”训练加速卡和“邃思2.0”芯片

燧原产品的商业落地场景包括，液冷超大规模集群，加速视频内容生产；强化学习使能游戏AI，改变数字娱乐的方式；强大的视觉能力，保驾护航金融安全；边缘部署融合多数据，构建新型智能化交通；高效推理算力集群，建设园区AI视频云。

随着第二代产品的发布，将加速这些场景的商业化落地。

云燧智算集群

随着自然语言处理、强化学习、无监督学习、多模态和认知模型等的发展，在知识图谱、智慧大脑、游戏引擎、融合媒体和通用人工智能的应用上，绿色一体化的超级智算集群是关键趋势。

燧原发布CloudBlazer Matrix云燧智算集群，它代表世界最高水平，最高8192Enflame CloudBlazer训练卡和DTU芯片，最高1.3E（130000T）单精度智能算力集群。液冷/每一体化PUE降到1.15以下。最高160T单精度张量训练卡以及80%的线性度。

这是为智能计算和新基建算力而推出的集群化产品。CloudBlazer Matrix 2.0将包括邃思DTU2.0，云燧CloudBlazer T20/T21板卡，和驭算软件Topsrider2.0。

打造中国最大的计算芯片，邃思DTU2.0性能强悍

邃思DTU2.0是中国最大的计算芯片，突破封装的极限。DTU2.0采用2.5D高级封装，整合9颗芯片，其中1颗DTU芯片、4颗三星HBM2E等构成先进封装。封装尺寸为57.5mm*57.5mm。

燧原科技第二代通用人工智能训练芯片“邃思2.0”

DTU2.0的计算能力，单精度FP32达40FLOPS，支持单精度张量TF32，达160T FLOPS。TF32格式被认为是在数据中心最先进的数据模式。

此外，DTU2.0植入完全可编程的数据流，软件指令驱动的传输和数据计算，标量、向量和张量的高效数据处理，和多地址广播等。

存储方面，邃思2.0共搭载了4颗HBM2E片上存储芯片，高配支持64GB内存，带宽达1.8TB/s，是中国第一个支持世界最先进存储HBM2E和单芯片64 GB内存的产品。

6个LARE卡间互联端口，每一个端口双向50GB/s，总集群互联带宽300GB/s。

云燧T21\T20训练产品，分别为OAM标准模组和全高全长PCIE板卡。

以Benchmark数据来看，云燧T20与友商次旗舰相比，在图像识别/分类、NLP、目标检测、图像分割、推荐等均有明显优势。

驭算Topsrider2.0架构

驭算TopsRider是燧原科技自主知识产权的计算及编程平台，通过软硬件协同架构设计，充分发挥邃思2.0的性能；基于算子泛化技术及图优化策略，支持主流深度学习框架下的各类模型训练；利用Horovod分布式训练框架与GCU-LARE互联技术相互配合，为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口，为客户模型的优化提供了自定义的开发能力。

云端训练计算产品路线图

训练产品方面，燧原计划第三代T30/T31产品将于2023年发布，每瓦的能效将提升14倍。同时升级到Matrix3.0。

推理计算方面，2021年下半年将发布i20推理芯片，以及2023年将发布i30。其每瓦能效将分别提升4倍和16倍。

另外，在Topsrider2.x的基础上，还将进一步升级至Topsrider3.x，致力于泛AI生态。

生态建设

AI生态也是跨行业的、复杂的生态竞争。燧原推出的异构计算生态燎原计划，将聚集生态的三大特征：原始创新、标准化和生态共建。

燎原计划将建立繁荣开放的开发者生态，健康互利的产业生态，持续创新的科研生态。打造以人工智能为起点构建通用异构计算生态，构建标准化的技术体系，共建完整生态服务数字中国。将涵盖深度学习计算，通用异构计算以及视觉计算。

赵立东表示，未来行业的发展趋势表明，以芯片为核心的算力，是工业4.0兵家必争之地。工业4.0时代，人工智能是关键动力。摩尔定律放缓，异构计算加速，基于小芯片、封装技术，人工智能落地将改变互联网重塑传统行业。算力需示爆炸，算力成为人工智能技术发展的基础。燧原科技要建立世界水平的本土化研发和工程化团队，开发国产自主创新的核心技术，布局云端AI+高端芯片双赛道。我们为数据中心打造最优的云端AI产品，形成训练推理完整的闭环解决方案。

本文由电子发烧友原创，作者黄晶晶，微信号kittyhjj，转载请注明以上来源。如需入群交流，请添加微信elecfans999，投稿发邮件到huangjingjing@elecfans.com。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31157

浏览量
269502
燧原科技

燧原科技

+关注

关注
0

文章
125

浏览量
8344

《中国汽车芯片联盟白名单》2.0版本发布，覆盖300多家厂商的超1800款产品

电子发烧友网报道（文/吴子鹏）日前，为了及时向行业提供更加准确有效的产品信息，更好地推动国产汽车芯片得到广泛应用，中国汽车芯片产业创新战略联盟在其官方微信公众号正式发布了《

发表于 12-05 00:04 •3547次阅读

《<b class='flag-5'>中国</b>汽车<b class='flag-5'>芯片</b>联盟白名单》<b class='flag-5'>2.0</b>版本<b class='flag-5'>发布</b>，覆盖300多家厂商的超1800款产品

清华光芯片取得新突破，迈向AI光训练

电子发烧友网报道（文/吴子鹏）近日，清华大学发布官方消息称，清华大学电子工程系方璐教授课题组、自动化系戴琼海院士课题组另辟蹊径，首创了全前向智能光计算训练架构，研制了“太极-II”光训练

发表于 08-13 01:23 •3206次阅读

燧原科技亮相2024中国人工智能大会

近日，燧原科技创新研究院首席研究员石恒博士受邀在2024中国人工智能大会的“AI芯片与智能计算创新生态”专题论坛上，发表了《面向

发表于 12-19 13:58 •227次阅读

亚马逊转向Trainium芯片，全力投入AI模型训练

，亚马逊AWS推出了两款芯片：Inferentia和Trainium。其中，Inferentia主要用于AI推理，而Trainium则专注于AI模型的训练。然而，随着生成式

发表于 12-13 14:14 •307次阅读

2024深圳 | 中国AI芯片开发者论坛

“2024中国AI芯片开发者论坛”将于12月5-6日在深圳举办。本次论坛由车乾信息&热设计网主办，深圳工业展协办，本次论坛重点探讨：高算力AI芯片

发表于 11-20 01:02 •924次阅读

Untether发布人工智能(AI)芯片

初创企业Untether发布了一款专为汽车、农业装备及极端环境AI应用设计的人工智能（AI）芯片。　　相较于英伟达和AMD的旗舰AI

发表于 10-29 13:59 •350次阅读

AI算力芯片供电电源测试利器:费思低压大电流系列电子负载

AI算力芯片作为驱动复杂计算任务的核心引擎，其性能与稳定性成为了决定应用成败的关键因素。而在这背后，供电电源的稳定性和高效性则是保障AI算力芯片

发表于 10-25 11:26 •572次阅读

燧原科技启动IPO辅导，加速AI算力底座布局

近日，中国证监会正式披露了上海燧原科技股份有限公司（简称：燧原科技）的IPO辅导备案报告，标志着这家AI芯片领域的独角兽企业正式踏上了上市征

发表于 08-29 15:49 •448次阅读

AI芯片的混合精度计算与灵活可扩展

、NPU、DSP等。而无论是哪种架构，如何判断其性能优劣都至关重要，而这就涉及到AI芯片的各项性能指标，如算力、能效、时延等。其中AI芯片的算力精度是衡量其处理数据能力的重要指标

发表于 08-23 00:08 •4923次阅读

中国Wi-Fi7 FEM F4诞生

。在2024年年初，三伍微推出了Wi-Fi7 FEM，性能不输国际厂商。脚步不能停留，Wi-Fi8已经在路上。有未来的路，是幸福的路。至此，中国Wi-Fi7 FEM的F4正式诞生，可以量产供应

发表于 07-31 11:14

苹果承认使用谷歌芯片来训练AI

苹果公司最近在一篇技术论文中披露，其先进的人工智能系统Apple Intelligence背后的两个关键AI模型，是在谷歌设计的云端芯片上完成预训练的。这一消息标志着在尖端AI

发表于 07-30 17:03 •748次阅读

AI初出企业Cerebras已申请IPO！称发布的AI芯片比GPU更适合大模型训练

美国加州，专注于研发比GPU更适用于训练AI模型的晶圆级芯片，为复杂的AI应用构建计算机系统，并与阿布扎比科技集团G42等机构合作构建超级

发表于 06-26 00:09 •2935次阅读

AI芯片哪里买？

AI芯片

芯广场
发布于 :2024年05月31日 16:58:19

risc-v多核芯片在AI方面的应用

得RISC-V多核芯片能够更好地适应AI算法的不同需求，包括深度学习、神经网络等，从而提高芯片的性能和效率，降低成本，使AI边缘计算晶片更具

发表于 04-28 09:20

联想向燧弘华创交付首台搭载国产AI算力芯片的问天WA5480 G3服务器

3月19日，在联想集团(全球)最大的智能计算设备研发和制造基地——联宝科技，联想集团向燧弘华创交付联想首台可搭载国产AI算力芯片的联想问天W

发表于 03-22 09:40 •904次阅读

搜索历史

中国最大的计算芯片诞生！燧原科技发布邃思2.0 AI训练芯片

评论

《中国汽车芯片联盟白名单》2.0版本发布，覆盖300多家厂商的超1800款产品

清华光芯片取得新突破，迈向AI光训练

燧原科技亮相2024中国人工智能大会

亚马逊转向Trainium芯片，全力投入AI模型训练

2024深圳 | 中国AI芯片开发者论坛

Untether发布人工智能(AI)芯片

AI算力芯片供电电源测试利器:费思低压大电流系列电子负载

燧原科技启动IPO辅导，加速AI算力底座布局

AI芯片的混合精度计算与灵活可扩展

中国Wi-Fi7 FEM F4诞生

苹果承认使用谷歌芯片来训练AI

AI初出企业Cerebras已申请IPO！称发布的AI芯片比GPU更适合大模型训练

AI芯片哪里买？

risc-v多核芯片在AI方面的应用

联想向燧弘华创交付首台搭载国产AI算力芯片的问天WA5480 G3服务器