0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Ampere架构GPU带来了什么

姚小熊27 来源:比特网 作者:比特网 2020-12-01 10:39 次阅读

在今年10月份,NVIDIA正式发布了采用8nm制程工艺Ampere架构的RTX A6000、RTX A40两款专业图形和计算GPU,这两款产品采用RT Core、Tensor Core和CUDA Core,旨在加速图形、渲染、计算和AI,分别面向工作站和服务器用途。

长久以来,NVIDIA在专业级别GPU领域不断进行创新,此前已经推出过Kepler、Maxwel、Pascal以及Turing等架构,此次,最新的Ampere架构在图形处理、AI、光线追踪等性能上又有进一步的提升。

NVIDIA 中国区高级技术市场经理施澄秋表示:“在过去20年里,NVIDIA在各式各样的图形和可视化运算及AI等不同领域,都针对GPU做出相应优化。NVIDIA GPU无论是在软硬件设计,还是功能改进,都针对不同用户产生了不同性能飞跃,包括现在很流行的AEC、BIM、CAM等。”

此外,NVIDIA还带来了全新Omniverse平台的秋季更新,有了这套平台,分散在各地的远程团队,能够同时针对特定的设计项目来进行协同作业。

Ampere架构GPU带来了什么

我们发现,在发布全新的RTX A6000系列显卡时,与此前的“Tesla”一样,“Quadro”品牌也被NVIDIA淡化了。NVIDIA没有对变更名称给出官方的解释,笔者认为主要是因为目前图形卡、计算卡的界限渐渐地模糊,产品线之间的重合度越来越高造成的,这也可以理解为NVIDIA未来的GPU产品线突破了自己“画的圈”,更加“野蛮”地生长。

随着Ampere架构的发布,NVIDIA进一步提升在GPU领域中主导地位,新架构与前代Turing相比有三大优势:

一、新一代的SM(新一代流式多处理器)架构最高可以提供39 TFLOPS的FP32算力。

二、第二代RT Core相对于第一代Turing架构里的RT Core最高可以提供76 TFLOPS光线追踪算力。和以往GPU不同的是除了SM之外,加入了RT Core、Tensor Core,该张量运算核心主要是针对AI里面最有倚重、最主要的运算单元Tensor Core。

三、新架构产品最多可以提供310个Tensor TFLOPS的算力。

NVIDIA Ampere架构和上一代Turing架构相比最重要的就是SM以及传统图形运算核心采用全新设计,进行全新增强,并采用基于全新架构及设计第二代RT Core及第三代Tensor core,使得RTX A6000在性能、AI、光线追踪等方面获得了非常大的增强。

施澄秋表示:“其实就CAD、CAM或者模拟,以及整个大型复杂零组件装配等工作来说,对于GPU的依赖程度非常高。企业去设计一款产品,产品本身可能对于用户而言只是一个最终拿到手上的物品,但生产制造设计人员其实经历了非常多的繁琐、冗长的步骤。”

也的确如此,比如设计一款产品要经过选择材质、考虑材质的牢固程度、材质的耐磨损程度、材质使用过程中的舒适程度以及美观程度,还要考虑产品是否符合人体工学等等一系列的设计和制造流程。在过程中要花费设计人员相当多的时间与精力。

而在使用高性能的RTX A6000或A40时,就可以帮助大家节约很多的工作时长、能够大幅提升工作流程和效率,优化每一个步骤。这样的过程中,其实NVIDIA专业可视化显卡一直以来都是生产类工具。

对于采用A6000的实例,美国NASA给出了一个评价很有意思,他们觉得新一代Ampere架构的A6000与双路的上一代旗舰级别的RTX8000运算能力差不多,而且,功耗、散热、噪音以及管理成本都下降不少,这足以说明Ampere架构的提升。

让远程协助更简单

今年的疫情改变了很多人的工作方式,其中就包括创意工作者以及开发人员。

一直以来,设计人员为了创建视觉效果、建筑可视化和制造设计,需要不同团队协作,并且,在设计完成之后还需要多个客户进行审查。

由于不同的文件格式、所有权、软件和团队不连通等问题,不同软件之间无法建立联系,不但会导致信息延迟,在某些情况下还会影响效率甚至阻碍工作的完成。Omniverse能够让不同的设计师使用不同的工具,无缝地完成同一个设计项目的不同部分。

在Omniverse推出之后,另一个关键创新是仅需一键点击即可在Autodesk.Revit、McNeel.Rhino或Trimble.SketchUp之间进行切换。用户无需进行数据准备或抽样,就能使用兼容的照片级逼真的渲染软件浏览大型模型。这就避免了转化延迟和切换软件工具造成的错误,大量节省了时间和成本。

此外,Omniverse还更好地对光线追踪进行支持,可以把实时光线追踪的能力带到任何一个设备上。我们以前给客户做演示的时候会拿一个手机或者平板电脑,客户可能只会看到一张图或者一个视频,既不可交互也不能改变视角。

借助Omniverse平台,设计师可以用流媒体的方式把设计程序,甚至整套流程串流到任何一个设备上。只需一台平板电脑/手机/上网本/轻型笔记本,就可以给客户进行演示,而且还可以得到实时反馈,让客户看到当前设计的状况,甚至可以利用AR/VR的方式让用户更真实的体验你所使用地应用程序。

如果Omniverse平台有RTX A6000显卡加持,会创造出什么样的画面呢?在NVIDIA刚刚放出来的夜间版《Marbles》便是这两者合体的杰作,施澄秋介绍:“视频中物体的摩擦、弹跳、互动,包括里面不同位置的声音全部由NVIDIA Ampere架构的技术来完成。该视频制作者来自超过12个团队,几十个工程师和设计师分散在全世界各个地方,实时利用NVIDIA Omniverse和NVIDIA RTX Ampere架构GPU完成了这一艺术创举。”

写在最后

在Turing架构推出三年之后,NVIDIA为大家带来了更加强悍的Ampere架构,让我们再一次感受到GPU性能的提升,而且二代RT Core、Tensor Core的引入对全新光线追踪和AI性能的加强也让其成为更出色的生产工具。

今年7月NVIDIA市值达到2513亿美元,首度超越Intel成为美国市值最高半导体公司,截止至目前,其市值更突破3000亿美元大关,在NVIDIA刚刚发布的第三季度财报中,创下收入47.3亿美元的记录。一个个记录随时间迁移不断被打破,未来还会发生什么?我们非常期待。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4986

    浏览量

    103065
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4740

    浏览量

    128950
  • Ampere
    +关注

    关注

    1

    文章

    66

    浏览量

    4544
收藏 人收藏

    评论

    相关推荐

    芯原发布新一代Vitality架构GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架构的图形处理器(GPU)IP系列。这一新一代GPU架构以其卓越的计算性能和广泛的应用领域,吸引了业界的广泛关注。 Vitality
    的头像 发表于 12-24 10:55 138次阅读

    《算力芯片 高性能 CPUGPUNPU 微架构分析》第3篇阅读心得:GPU革命:从图形引擎到AI加速器的蜕变

    在数据挖掘工作中,我经常需要处理海量数据的深度学习任务,这让我对GPU架构和张量运算充满好奇。阅读《算力芯片》第7-9章,让我对这些关键技术有了全新认识。 GPU架构从早期的固定功能流
    发表于 11-24 17:12

    芯至科技与Ampere达成业务合作

    近日芯至科技与全球知名现代化半导体公司Ampere Computing达成BMC系统研发业务合作。
    的头像 发表于 11-07 13:46 273次阅读

    GPU服务器AI网络架构设计

    众所周知,在大型模型训练中,通常采用每台服务器配备多个GPU的集群架构。在上一篇文章《高性能GPU服务器AI网络架构(上篇)》中,我们对GPU
    的头像 发表于 11-05 16:20 355次阅读
    <b class='flag-5'>GPU</b>服务器AI网络<b class='flag-5'>架构</b>设计

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU

    本篇阅读学习第七、八章,了解GPU架构演进及CPGPU存储体系与线程管理 █从图形到计算的GPU架构演进 GPU图像计算发展 ●从三角形开始
    发表于 11-03 12:55

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    GPU、NPU,给我们剖析了算力芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解算力芯片。 全书共11章,由浅入深,较系统全面进行讲解。下面目录对全书内容有一个整体了解
    发表于 10-15 22:08

    【「大模型时代的基础架构」阅读体验】+ 未知领域的感受

    ”,好奇于这种大模型算力中心到底是如何建设的,用什么设备、什么架构建设的?对这些问题真是一无所知,甚至都没有想过,带着这份好奇开始阅读。 先浏览目录,共分十三章,目录中出现最多的就是GPU,比如机器学习
    发表于 10-08 10:40

    名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    的强有力竞争者;苹果、Cerebras、Ampere、特斯拉等企业的加入让这场“算力芯片战争”更加热闹。 CPU、GPU、NPU等芯片是推动科技创新的基石,算力的提升直接影响到产业的数字化转型和升级
    发表于 09-02 10:09

    GPU云服务器架构解析及应用优势

    GPU云服务器作为一种高性能计算资源,近年来在人工智能、大数据分析、图形渲染等领域得到了广泛应用。它结合了云计算的灵活性与GPU的强大计算能力,为企业和个人用户提供了一种高效、便捷的计算解决方案。下面我们将从架构解析和技术优势两
    的头像 发表于 08-14 09:43 391次阅读

    NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-26 11:25 625次阅读

    全新NVIDIA RTX A400和A1000 GPU全面加强AI设计与生产力工作流

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-18 10:29 533次阅读

    X-Silicon发布RISC-V新架构 实现CPU/GPU一体化

    X-Silicon 的芯片与其他架构不同,其设计将 CPU 和 GPU 的功能整合到单核架构中。这与英特尔和 AMD 的典型设计不同,前者有独立的 CPU 内核和 GPU 内核。
    发表于 04-08 11:34 586次阅读
    X-Silicon发布RISC-V新<b class='flag-5'>架构</b> 实现CPU/<b class='flag-5'>GPU</b>一体化

    FPGA在深度学习应用中或将取代GPU

    的玩家来说不是什么大问题。但在其他领域,如汽车行业,需要硬件有更高的耐用性,这就带来了问题。特别是过多的暴露在恶劣的环境中,再加上高强度的使用,GPU 的使用寿命将会更短。 Larzul 说:“从商
    发表于 03-21 15:19

    NVIDIA的Maxwell GPU架构功耗不可思议

    整整10年前的2013年2月19日,NVIDIA正式推出了新一代Maxwell GPU架构,它有着极高的能效,出场方式也非常特别。
    的头像 发表于 02-19 16:39 1026次阅读
    NVIDIA的Maxwell <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>功耗不可思议

    深入解读AMD最新GPU架构

    GCN 取代了 Terascale,并强调 GPGPU 和图形应用程序的一致性能。然后,AMD 将其 GPU 架构开发分为单独的 CDNA 和 RDNA 线路,分别专门用于计算和图形。
    发表于 01-08 10:12 1226次阅读
    深入解读AMD最新<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>