AMD发布全新架构计算卡Instinct MI100：AI性能暴涨7倍-电子发烧友网

在游戏领域，基于RDNA 2架构的Radeon RX 6000系列显卡已经开始闪亮登场。在高性能计算领域，基于CDNA全新架构的新一代计算卡Instinct MI100也终于登台了！

AMD Radeon Instinct系列计算卡已经发展了多款型号，但是在此之前，AMD GPU一直都是一套架构打天下，游戏、计算不分家，自然不利于不同方向的深度优化。

今年3月份，AMD宣布了首个专门针对数据中心高性能计算而设计的CDNA架构，从此与RDNA游戏架构分道扬镳。二者虽然还有一些共通点，但在设计、优化上已经泾渭分明，在各自领域的性能、能效也更高。

而在产品命名方面，AMD计算卡也放弃了Radeon字样，不再称呼Radeon Instinct，而是简单地叫做Instinct。

AMD Instinct可以说是专为HPC高性能计算而生的，志在推动超级计算机进入百亿亿次计算时代(ExaScale)。

回顾历史，21世纪的前10个年头属于万亿次计算时代(TeraScale)，完全依赖CPU运算；最近10个年头属于千万亿次计算时代(PetaScale)，GPU加速运算展露锋芒。

不过近两年，传统的GPU加速计算也已经初显疲态，性能增强曲线也缓了下来，必须实现全新的突破。

CDNA架构和MI100加速卡就是这样的突破性产品，也是AMD开拓新未来的新旗舰。

AMD Instinct MI100是其迄今为止性能最高的HPC GPU，FP64双精度浮点性能首次突破10TFlops(也就是每秒1亿亿次)，并在架构设计上专门加入了Matrix Core(矩阵核心)，用于加速HPC、AI运算，号称在混合精度和FP16半精度的AI负载上，性能提升接近7倍。

另外，新卡的外观设计也令人眼前一亮，更有质感的拉丝外壳，深灰色调，非常沉稳大气。

它集成多达120个计算单元、7680个流处理器，搭配32GB HBM2，带宽高达1.23TB/s，同时支持PCIe 4.0，集成Infinity Fabric x16高速互联通道，峰值带宽达276GB/s(相当于PCIe 4.0 x16的大约4倍)，而整卡功耗控制在300W。

计算性能方面，FMA64/FP64双精度为11.5TFlops(每秒1.15亿亿次)，FMA32/FP32单精度为23.1TFlops(每秒2.31亿亿次)，FP32 Matrix单精度矩阵计算为46.1TFlops(每秒4.61亿亿次)，FP16 Matrix半精度矩阵计算为184.6TFlops(每秒18.46亿亿次)，Bfloat16浮点为92.3TFlops(每秒9.23亿亿次)。

这些数字是什么概念呢？

就拿11.5TFlops的双精度性能来说，2000年排名世界第一的超级计算机ASCI White，这个指标也不过12.3TFlops，但却是付出了600万瓦的功耗、106吨的身材才获得的，Instinct MI100却只要300瓦、1.16千克。

换言之，如今的一块卡，就相当于20年前的一个大规模计算集群！

AMD上代计算卡Instinct MI50采用的还是Vega 20核心，60个计算单元，3840个流处理器，32GB HBM2显存带宽1TB/s，Infinity Fabric总线带宽92GB/s，功耗300W。

Instinct MI100的核心规模翻了一番，显存带宽提升了超过20％，Infinity Fabric带宽提升了整整2倍，但是功耗却完全没变(工艺应当也还是7nm)，新架构的能效可见一斑。

新卡的性能更是不可同日而语，FP64双精度、FP32单精度性能均提升74％，FP32矩阵性能提升接近2.5倍，AI负载性能更是几乎7倍的飞跃。

在美国能源部旗下的橡树岭国家实验室，AMD MI100计算卡已经在支撑多项百亿亿次科研项目，涉及NAMD分子动力学模拟、CHOLLA星系形成研究、PIConGPU激光放射癌症疗法、GESTS流体动力学等等诸多前沿科技。

AMD Instinct MI100计算卡还有一个绝佳搭档，那就是AMD自家的霄龙数据中心处理器，慧与、戴尔、超威、技嘉等多家行业巨头都有提供这种双A方案。

当然了，只有硬件，是做不成高性能计算的，AMD同时一直在推进一站式软件解决方案ROCm。

从2016年初入江湖的1.x版本，2018年奠定基础的2.0版本，到2019年专注于机器学习的3.0版本，再到如今最新的4.0版本，AMD ROCm已经打造成了一整套针对机器学习、高性能计算的百亿亿次级开发方案，规划中的各项功能特性也基本都已经实现。

软件优化的力量无疑是巨大的，可以充分释放硬件潜力，比如说上代MI50，搭配ROCm 3.0的话性能相比于搭配ROCm 2.0可以提升3-4倍，而最新的MI100、ROCm 4.0联合，更是可以轻松带来5-8倍的性能提升。

AMD ROCm生态的进步速度非常快，已经有众多领域的头部厂商采纳和支持，而且它沿袭了AMD一贯的原则，那就是完全开源开放，非常方便代码迁移，比如说HACC(宇宙学)只用了一个下午，SPECFEM3D(地震学)半天就搞定，CHOLLA(天体物理学)花了几天，QUDA(量子物理学)也不过21天。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

amd

amd

+关注

关注
25

文章
5511

浏览量
134919
显卡

显卡

+关注

关注
16

文章
2481

浏览量
68458

AMD最强AI芯片，性能强过英伟达H200，但市场仍不买账，生态是最大短板？

。其中，全新旗舰AI芯片的型号为AMD Instinct MI325X GPU，虽然仍然是采用CDNA 3

发表于 10-14 01:32 •3641次阅读

<b class='flag-5'>AMD</b>最强<b class='flag-5'>AI</b>芯片，<b class='flag-5'>性能</b>强过英伟达H200，但市场仍不买账，生态是最大短板？

AMD将DeepSeek-V3模型集成至Instinct MI300X GPU

AMD近日宣布了一项重要进展，成功将全新的DeepSeek-V3模型集成到其Instinct MI300X GPU上。这一举措标志着AMD在

发表于 02-06 09:41 •238次阅读

消息称AMD Instinct MI400 AI加速器将配备8个计算芯片

近日，据外媒 videocardz 报道，参考 AMD 最新推出的 AMD - GFX 补丁程序，其中暗示 AMD 旗下的 Instinct MI

发表于 02-05 15:07 •280次阅读

AMD集成DeepSeek-V3模型至Instinct MI300X GPU

SGLang协同工作，以实现最佳性能，为用户提供更加流畅、稳定的使用体验。 Instinct MI300X GPU作为AMD的顶级产品，具备出色的计

发表于 02-05 13:58 •239次阅读

《CST Studio Suite 2024 GPU加速计算指南》

的GPU不能在单个主机系统中组合使用。 - AMD GPU：目前只有时域求解器（FIT）支持AMD GPU，如Instinct MI 210、Radeon VII等，并给出了相关规格

发表于 12-16 14:25

IBM与AMD携手部署MI300X加速器，强化AI与HPC能力

举措预计将于2025年上半年正式推出。此次合作的核心目标是提升通用人工智能(AI)模型的性能与能效，并为企业客户提供高性能计算(HPC)应用的强大支持。

发表于 11-21 11:07 •347次阅读

IBM与AMD携手将在IBM云上部署AMD Instinct MI300X加速器

合作服务预计将于2025年上半年正式推出。AMD Instinct MI300X加速器作为AMD在高性能

发表于 11-19 11:03 •554次阅读

AMD发布新版Instinct MI325X

今日，芯片行业的老牌巨头AMD在AI领域交出了一份令人瞩目的答卷。　　美国时间10月10日，AMD在旧金山成功举办了Advancing AI

发表于 10-12 16:54 •867次阅读

AMD发布新一代AI芯片MI325X

在旧金山举办的Advancing AI 2024大会上，AMD正式推出了其新一代AI芯片——GPU AMD Instinct

发表于 10-11 15:55 •532次阅读

三星首度引入AMD MI300X，缓解AI GPU短缺

三星电子近日斥资约270亿韩元（约合1.42亿元人民币），购买了AMD Instinct MI300X加速器。这一举措标志着三星电子首次引入非英伟达品牌的AI GPU，以应对企业内部算

发表于 10-10 17:15 •661次阅读

AMD MI350挑战英伟达Blackwell，AI投资持续强劲

AMD首席执行官苏姿丰（Lisa Su）近日宣布，公司即将推出的MI350芯片将直接与英伟达的Blackwell架构芯片展开激烈竞争，标志着高性能计

发表于 08-05 11:27 •658次阅读

AMD发布全新AI芯片Instinct MI325X

在近日举行的COMPUTEX台北国际电脑展上，AMD董事长兼CEO苏姿丰发表了精彩演讲，并正式发布了一款备受瞩目的AI芯片——Instinct MI

发表于 06-04 14:49 •1120次阅读

AMD发布AI芯片MI325X 预计2024年第四季度上市

第四季度上市。苏姿丰女士在演讲中特别强调，早前发布的MI300已经成为了AMD公司发展历程中的一款标志性产品，而全新的MI325X则搭载了H

发表于 06-03 15:41 •1082次阅读

借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

对于大规模数据处理，最佳性能不仅取决于原始计算能力，还取决于高存储器带宽。因此，全新 AMD Alveo™ V80 计算加速

发表于 05-16 14:09 •313次阅读

人工智能市场风向转变，AMD Instinct MI300X GPU更受欢迎

近一半的受访者表示对AMD的Instinct MI300X GPU持乐观态度。与英伟达的H100系列相比，MI300X不仅价格与

发表于 03-11 15:28 •1188次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

AMD发布全新架构计算卡Instinct MI100：AI性能暴涨7倍

评论

AMD最强AI芯片，性能强过英伟达H200，但市场仍不买账，生态是最大短板？

AMD将DeepSeek-V3模型集成至Instinct MI300X GPU

消息称AMD Instinct MI400 AI加速器将配备8个计算芯片

AMD集成DeepSeek-V3模型至Instinct MI300X GPU

《CST Studio Suite 2024 GPU加速计算指南》

IBM与AMD携手部署MI300X加速器，强化AI与HPC能力

IBM与AMD携手将在IBM云上部署AMD Instinct MI300X加速器

AMD发布新版Instinct MI325X

AMD发布新一代AI芯片MI325X

三星首度引入AMD MI300X，缓解AI GPU短缺

AMD MI350挑战英伟达Blackwell，AI投资持续强劲

AMD发布全新AI芯片Instinct MI325X

AMD发布AI芯片MI325X 预计2024年第四季度上市

借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

人工智能市场风向转变，AMD Instinct MI300X GPU更受欢迎