0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD公开VEGA GPU架构使用7nm工艺

传感器技术 来源:未知 作者:工程师郭婷 2018-06-29 16:17 次阅读

在日前举行的Computex 2018发布会上,AMD有些出人意料地进行了高规格产品发布,公开的产品包括下一代使用7nm工艺的VEGA GPU,以及使用7nm的Zen 2处理器。目前,7nm VEGA GPU是全球第一个使用7nm工艺的GPU,现在已经开始样品出货,预计在今年下半年开始大规模出货。这比之前预期的时间表提前了不少,也打了Nvidia一个措手不及,让AMD以迅雷不及掩耳之势抢得了“全球第一块7nm GPU”。

除了GPU之外,AMD还公布了下一代使用7nm工艺的Zen 2处理器EPYC,该处理器目前已经完成流片正处于实验室测试中,预计将于2018年下半年进入工程样品阶段并于2019年进入大规模出货阶段。

随着桌面PC市场被移动设备日渐蚕食,在本世纪初热闹非凡的Computex会议已经几乎被人遗忘。而AMD此次在Computex会议上举行的高规格产品发布无疑是为之前有些疲软的计算机市场和Computex会议带来了一阵新风。这也释放了一个重要信号:以数据中心为主要应用场景的高性能计算市场正在接过PC的接力棒,将会成为计算机在下一个十年发展的主要动力。

数据中心的想象空间

随着大数据和深度学习的高速发展,数据正在成为新时代的原油而算力正在成为下一代的基础设施。AMD在发布会上指出,到2025年的数据将会增长50倍:可穿戴设备、IoT5G设备正在普及,这些设备都会产生大量的数据。除此之外,我们对于这些数据的处理方式也越来越复杂,机器学习领域的新算法层出不穷,能够从数据中提取更多有用信息,从而在智慧城市、医疗、金融、安保等领域引入革命性的变化。随着数据量和算法复杂度的飞速提升,对于算力的需求也在高速增长。

OpenAI公布的深度学习算法算力需求,6年增长了30万倍

大数据算力的主要基础设施在于数据中心。数据中心对于处理器的需求目前主要包括CPU和GPU。CPU是传统计算硬件,可以支持通用计算,也是数据中心必不可少的一部分。AMD此次公布的EPYC CPU每个socket至多可以支持32个核。除了核心数多之外,CPU的内存存取和CPU间通信在需要高效执行分布式计算的数据中心也是重要要素,而EPYC每个CPU能支持至多8个内存通道和128条PCIe通道,可谓性能强大。众所周知,AMD在数据中心CPU领域并非传统强项,在Intel牢牢把持着市场的情况下AMD如何打入数据中心CPU生态也就成了大家关注的要点之一。在本次发布会上,AMD宣布了EPYC已经进入了CISCO,HP和腾讯云等重要客户的产品中。虽然比起Intel在数据中心的市场份额来说AMD还有很大的差距,但是这也是个不错的出发点。

除了CPU之外,GPU是数据中心想象空间更大的部分。在大数据时代,CPU并不能高效支持所有运算:在CPU的芯片上,为了满足通用算法的支持,有很大一部分芯片面积都用来做缓存和控制逻辑(如分支判断等),而用于计算单元的面积并不大。而在大数据算法中,大量数据是可以并行处理的(例如来自不同设备产生的独立数据就可以并行处理而不会互相影响),因此大数据算法往往比较规整,而CPU芯片上的许多控制逻辑对于大数据算法就显得多余。这时候擅长并行计算处理的GPU就脱颖而出。GPU的设计中控制逻辑比较简单,而绝大部分芯片面积都用来做计算单元,因此一个GPU往往包含了数千个计算核心,可以提供超高效并行计算,对于合适的大数据算法GPU的执行速度比同代CPU要快两到三个数量级。

GPU在数据中心中执行大数据算法的标志性事件是2012年的深度学习算法AlexNet的训练。AlexNet是深度学习的标志性算法,其贡献第一是证明在数据量足够的情况下深度神经网络在图像分类等任务中的性能远好于传统的支持向量机(SVM)等算法,可谓是开启了这一波深度学习热潮;除此之外AlexNet还提出了使用GPU去训练深度学习网络,相比CPU可以将训练时间降低两到三个数量级从而进入合理的范围(时间从数年下降到了几天)。可以说以深度学习离不开GPU的支持,而随着深度学习的继续普及,数据中心对于GPU的需求也在持续上升。

深度学习的普及是GPU在数据中心需求量持续上升的一个要素。除此之外,深度学习以外的其他需要GPU的算法也在推动GPU需求。众所周知的是区块链算法对于GPU也有很大的需求量,在区块链和加密货币最火的2017年各大矿场对于GPU的需求甚至让GPU卖到断货(AMD从中也是获利颇丰),之后虽然加密货币逐渐回归理性但是对于GPU的需求却在稳步上升。除了区块链之外,数据库等传统应用也在逐渐拥抱GPU加速。可以说目前数据中心对于GPU的需求是以深度学习为首,而在其他领域也在逐渐跟上。Nvidia目前在数据中心GPU市场几乎是处于垄断地位,与之相应数据中心业务在Nvidia的财报中也越来越重要,2017财年的数据中心业务增长高达245%,在2018财年的增长也有233%,收入接近20亿美元。AMD当然不会对数据中心这块市场坐视不管,这次抢先Nvidia发布7nm VEGA GPU以及Radeon Instinct数据中心加速卡也是对Nvidia一个强烈的挑战信号。

除了硬件之外,

开发生态同样重要

在数据中心市场,事实上BAT等各大客户也希望AMD能打破Nvidia的垄断地位,从而让高性能GPU的价格能回归合理的范围。AMD这次发布的7nm VEGA GPU以及Radeon Instinct加速卡可谓性能强大,Radeon Instinct加速卡使用了32GB HBM高速显存,并且VEGA GPU对于人工智能和机器学习也加入了硬件支持,具体性能值得期待。

在硬件性能之外,开发者生态也是决定性因素。Nvidia的战略眼光极其深远,在绝大部分人对于GPU的认识还局限于游戏图形加速的时候,Nvidia就已经看到了GPU在其他领域的潜力,于是开始了GPGPU(通用GPU)战略并开始了CUDA的开发。在经过数年的开发积累之后,又遇到了深度学习的大热,Nvidia的CUDA凭借着稳定的性能,易用的API接口,完整的文档和多年的开发者社区运营成为了相关开发者的首选,配合其GPU因此成为了数据中心的标配。另一方面,AMD对于GPGPU类的技术投入之前一直处于不温不火的状态,和高通等其他几个合作厂商在推广与CUDA相似的OpenCL但是其性能和易用性一直被开发者社区诟病。除此之外AMD在GPGPU领域的另一个举措是推出异构系统架构HSA(heterogeneous system architecture),HSA的初衷是打通CPU和GPU的内存空间,用于解决CPU和GPU之间内存互访造成的性能损失,然而至今HSA也只能说是普普通通并未引起太多波澜。

AMD当然也认识到了其开发生态不足造成的问题,因此在这次发布会上也特意提到了其GPGPU的最新举措即Radeon Open Ecosystem,可以支持TensorFlow,PyTorch,Caffe,MxNet等主流机器学习平台并将提供优化的库支持。然而,在开发生态领域AMD仍然是处于追赶地位,尤其是在Nvidia在数据中心的生态已经开始在探索GPU数据库等蓝海的情况下,AMD如何迎头赶上值得我们关注。

7nm提升有限,

封装技术同样重要

从芯片角度,这次AMD的发布也让我们看到了半导体制程发展的趋势。

AMD发布了7nm VEGA GPU的数据。耐人寻味的是,其性能相对于上一代14nm的VEGA仅仅提升了35%。在特征尺寸缩小一半加上设计也有改善的情况下,其性能的提升幅度并不大:7nm半导体工艺节点中虽然特征尺寸缩小晶体管开关速度会加快但是金属互联线带来的延迟也变大,因此对于芯片性能的帮助有限。另一方面,其晶体管密度和功耗改善有两倍之多,这基本延续了之前摩尔定律的势头。

在特征尺寸对于芯片性能提升帮助有限的情况下,封装技术将会成为芯片性能提升的另一个推力。在本次发布会上,AMD发布的Radeon Instinct加速卡中一个最重要的关键词就是32GB HBM内存。HBM使用高级封装技术,将处理器和DRAM做在同一个封装内,可以大大降低走线长度,增加走线密度和总线宽度,从而提供远高于传统DDR标准的内存带宽。事实上,目前内存带宽已经成为了阻碍处理器完全发挥峰值计算能力的重要瓶颈,因此HBM内存将会成为处理器性能提升的重要技术。

AMD公开 VEGA GPU架构使用 7nm 工艺

AMD在今年ISSCC发布的Zeppelin架构

此外,AMD还宣布将会在7nm VEGA GPU中使用Infinity Fabric。Infinity Fabric与Nvidia的NVLink有相似也有不同的地方,NVLink主要是用于加速多块GPU间的数据通信,而Infinity Fabric则即可以用于片上网络(NoC),也可以用于封装内的互联或者片外互联。除了在VEGA GPU内使用之外,AMD还将在其CPU中搭配Zeppelin架构使用Infinity Fabric。Zeppelin是AMD今年在ISSCC会议上发布的新架构,通过高级封装技术和Infinity Fabric互联技术可以在封装内高效集成多块芯片,从而实现灵活的集成模式,根据需求可以集成多块处理器芯片或者是多块不同的芯片。在高级封装领域,AMD非常重视,在几年前的GPU中用上了HBM内存,而随着Zeppelin架构的发展我们看到AMD正在往封装方向继续深挖潜力。当然,Intel也并不落后,其EMIB高级封装技术也处于领先位置。AMD、Intel和Nvidia在高级封装领域的竞争,我们还将继续关注追踪。

结语

AMD此次在Computex上发布的7nm产品彰显了其进军数据中心应用的决心,而数据中心应用可望能接过PC的大旗成为计算机市场的下一个发展动力。在芯片技术方面,7nm工艺提供的优势主要在于集成度和功耗,对于性能的提升除了特征尺寸缩小之外还得依靠封装技术。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5453

    浏览量

    133987
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10832

    浏览量

    211301

原文标题:AMD突然发布7nm芯片背后的野心

文章出处:【微信号:WW_CGQJS,微信公众号:传感器技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU

    本篇阅读学习第七、八章,了解GPU架构演进及CPGPU存储体系与线程管理 █从图形到计算的GPU架构演进 GPU图像计算发展 ●从三角形开始
    发表于 11-03 12:55

    AMD与NVIDIA GPU优缺点

    在图形处理单元(GPU)市场,AMD和NVIDIA是两大主要的竞争者,它们各自推出的产品在性能、功耗、价格等方面都有着不同的特点和优势。 一、性能 GPU的性能是用户最关心的指标之一。在高端市场
    的头像 发表于 10-27 11:15 515次阅读

    所谓的7nm芯片上没有一个图形是7nm

    本身做过深入解释和探讨当然,关于国产7nm工艺技术的具体来源细节,我其实了解也不多,也不方便公开讨论。但至少我觉得有必要写些文字给非半导体制造行业的人士讲解一下,一
    的头像 发表于 10-08 17:12 253次阅读
    所谓的<b class='flag-5'>7nm</b>芯片上没有一个图形是<b class='flag-5'>7nm</b>的

    存内计算——助力实现28nm等效7nm功效

    可重构芯片尝试在芯片内布设可编程的计算资源,根据计算任务的数据流特点,动态构造出最适合的计算架构,国内团队设计并在12nm工艺下制造的CGRA芯片,已经在标准测试集上实现了和7nm
    的头像 发表于 05-17 15:03 1811次阅读
    存内计算——助力实现28<b class='flag-5'>nm</b>等效<b class='flag-5'>7nm</b>功效

    RTX 5880 Ada Generation GPU与RTX™ A6000 GPU对比

    NVIDIA RTX™ 5880 Ada Generation GPU 是目前国内重量级 GPU,基于全新 NVIDIA Ada Lovelace 架构构建,采用 4nm 制成
    的头像 发表于 04-19 10:20 1663次阅读
    RTX 5880 Ada Generation <b class='flag-5'>GPU</b>与RTX™ A6000 <b class='flag-5'>GPU</b>对比

    X-Silicon发布RISC-V新架构 实现CPU/GPU一体化

    X-Silicon 的芯片与其他架构不同,其设计将 CPU 和 GPU 的功能整合到单核架构中。这与英特尔和 AMD 的典型设计不同,前者有独立的 CPU 内核和
    发表于 04-08 11:34 556次阅读
    X-Silicon发布RISC-V新<b class='flag-5'>架构</b> 实现CPU/<b class='flag-5'>GPU</b>一体化

    2024年全球与中国7nm智能座舱芯片行业总体规模、主要企业国内外市场占有率及排名

    7nm智能座舱芯片市场报告主要研究: 7nm智能座舱芯片市场规模: 产能、产量、销售、产值、价格、成本、利润等 7nm智能座舱芯片行业竞争分析:原材料、市场应用、产品种类、市场需求、市场供给,下游
    发表于 03-16 14:52

    Ethernovia推出全球首款采用7nm工艺的汽车PHY收发器系列样品

    硅谷初创企业 Ethernovia宣布推出全球首款采用 7nm 工艺的单端口和四端口 10G 至 1G 汽车 PHY 收发器系列样品,将在汽车领域带来巨大变革,满足软件定义车辆 (SDV) 不断增长的带宽需求
    的头像 发表于 03-15 09:07 973次阅读
    Ethernovia推出全球首款采用<b class='flag-5'>7nm</b><b class='flag-5'>工艺</b>的汽车PHY收发器系列样品

    AMD修复Radeon RX 7900 XTX GPU固件问题,并积极回应TinyBox反馈

    据悉,新兴的AI 服务器制造商 TinyBox 在上周公开表示选择非主流CDNA 3.0 架构,转而依赖 AMD RDNA 3.0 GPU 硬件。其创始人兼首席执行官George Ho
    的头像 发表于 03-07 11:19 632次阅读

    无意发展至10nm以下,第二梯队晶圆代工厂的成熟工艺现状

    梯队的厂商们还在成熟工艺上稳扎稳打。   早在两年前,我们还会将28nm视作成熟工艺以及先进工艺的分水岭。但随着3nm的推出,以及即将到来的
    的头像 发表于 02-21 00:17 3452次阅读
    无意发展至10<b class='flag-5'>nm</b>以下,第二梯队晶圆代工厂的成熟<b class='flag-5'>工艺</b>现状

    深入解读AMD最新GPU架构

    GCN 取代了 Terascale,并强调 GPGPU 和图形应用程序的一致性能。然后,AMD 将其 GPU 架构开发分为单独的 CDNA 和 RDNA 线路,分别专门用于计算和图形。
    发表于 01-08 10:12 1170次阅读
    深入解读<b class='flag-5'>AMD</b>最新<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>

    AMDGPU架构GCN现代化解读

    随着HD 5000和6000系列的发展,AMD的Terascale(万亿级)架构变得非常具有竞争力。
    的头像 发表于 01-08 09:58 1141次阅读
    <b class='flag-5'>AMD</b>的<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>GCN现代化解读

    值得入手的AMD Radeon 显卡推荐—— AMD Radeon RX 7900 XT

    结合5nm和6nm工艺节点,采用先进的小芯片(Chiplets)设计,全新的计算单元和第二代AMD高速缓存技术,相比AMD RDNA 2
    的头像 发表于 01-04 16:27 1304次阅读
    值得入手的<b class='flag-5'>AMD</b> Radeon 显卡推荐—— <b class='flag-5'>AMD</b> Radeon RX 7900 XT

    揭秘GPU: 高端GPU架构设计的挑战

    在计算领域,GPU(图形处理单元)一直是性能飞跃的代表。众所周知,高端GPU的设计充满了挑战。GPU架构创新,为软件承接大模型训练和推理场景的人工智能计算提供了持续提升的硬件基础。
    的头像 发表于 12-21 08:28 882次阅读
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>设计的挑战

    一文详解芯片的7nm工艺

    芯片的7nm工艺我们经常能听到,但是7nm是否真的意味着芯片的尺寸只有7nm呢?让我们一起来看看吧!
    的头像 发表于 12-07 11:45 5613次阅读
    一文详解芯片的<b class='flag-5'>7nm</b><b class='flag-5'>工艺</b>