0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Ampere架构GPU带来了什么

姚小熊27 来源:比特网 作者:比特网 2020-12-01 10:39 次阅读

在今年10月份,NVIDIA正式发布了采用8nm制程工艺Ampere架构的RTX A6000、RTX A40两款专业图形和计算GPU,这两款产品采用RT Core、Tensor Core和CUDA Core,旨在加速图形、渲染、计算和AI,分别面向工作站和服务器用途。

长久以来,NVIDIA在专业级别GPU领域不断进行创新,此前已经推出过Kepler、Maxwel、Pascal以及Turing等架构,此次,最新的Ampere架构在图形处理、AI、光线追踪等性能上又有进一步的提升。

NVIDIA 中国区高级技术市场经理施澄秋表示:“在过去20年里,NVIDIA在各式各样的图形和可视化运算及AI等不同领域,都针对GPU做出相应优化。NVIDIA GPU无论是在软硬件设计,还是功能改进,都针对不同用户产生了不同性能飞跃,包括现在很流行的AEC、BIM、CAM等。”

此外,NVIDIA还带来了全新Omniverse平台的秋季更新,有了这套平台,分散在各地的远程团队,能够同时针对特定的设计项目来进行协同作业。

Ampere架构GPU带来了什么

我们发现,在发布全新的RTX A6000系列显卡时,与此前的“Tesla”一样,“Quadro”品牌也被NVIDIA淡化了。NVIDIA没有对变更名称给出官方的解释,笔者认为主要是因为目前图形卡、计算卡的界限渐渐地模糊,产品线之间的重合度越来越高造成的,这也可以理解为NVIDIA未来的GPU产品线突破了自己“画的圈”,更加“野蛮”地生长。

随着Ampere架构的发布,NVIDIA进一步提升在GPU领域中主导地位,新架构与前代Turing相比有三大优势:

一、新一代的SM(新一代流式多处理器)架构最高可以提供39 TFLOPS的FP32算力。

二、第二代RT Core相对于第一代Turing架构里的RT Core最高可以提供76 TFLOPS光线追踪算力。和以往GPU不同的是除了SM之外,加入了RT Core、Tensor Core,该张量运算核心主要是针对AI里面最有倚重、最主要的运算单元Tensor Core。

三、新架构产品最多可以提供310个Tensor TFLOPS的算力。

NVIDIA Ampere架构和上一代Turing架构相比最重要的就是SM以及传统图形运算核心采用全新设计,进行全新增强,并采用基于全新架构及设计第二代RT Core及第三代Tensor core,使得RTX A6000在性能、AI、光线追踪等方面获得了非常大的增强。

施澄秋表示:“其实就CAD、CAM或者模拟,以及整个大型复杂零组件装配等工作来说,对于GPU的依赖程度非常高。企业去设计一款产品,产品本身可能对于用户而言只是一个最终拿到手上的物品,但生产制造设计人员其实经历了非常多的繁琐、冗长的步骤。”

也的确如此,比如设计一款产品要经过选择材质、考虑材质的牢固程度、材质的耐磨损程度、材质使用过程中的舒适程度以及美观程度,还要考虑产品是否符合人体工学等等一系列的设计和制造流程。在过程中要花费设计人员相当多的时间与精力。

而在使用高性能的RTX A6000或A40时,就可以帮助大家节约很多的工作时长、能够大幅提升工作流程和效率,优化每一个步骤。这样的过程中,其实NVIDIA专业可视化显卡一直以来都是生产类工具。

对于采用A6000的实例,美国NASA给出了一个评价很有意思,他们觉得新一代Ampere架构的A6000与双路的上一代旗舰级别的RTX8000运算能力差不多,而且,功耗、散热、噪音以及管理成本都下降不少,这足以说明Ampere架构的提升。

让远程协助更简单

今年的疫情改变了很多人的工作方式,其中就包括创意工作者以及开发人员。

一直以来,设计人员为了创建视觉效果、建筑可视化和制造设计,需要不同团队协作,并且,在设计完成之后还需要多个客户进行审查。

由于不同的文件格式、所有权、软件和团队不连通等问题,不同软件之间无法建立联系,不但会导致信息延迟,在某些情况下还会影响效率甚至阻碍工作的完成。Omniverse能够让不同的设计师使用不同的工具,无缝地完成同一个设计项目的不同部分。

在Omniverse推出之后,另一个关键创新是仅需一键点击即可在Autodesk.Revit、McNeel.Rhino或Trimble.SketchUp之间进行切换。用户无需进行数据准备或抽样,就能使用兼容的照片级逼真的渲染软件浏览大型模型。这就避免了转化延迟和切换软件工具造成的错误,大量节省了时间和成本。

此外,Omniverse还更好地对光线追踪进行支持,可以把实时光线追踪的能力带到任何一个设备上。我们以前给客户做演示的时候会拿一个手机或者平板电脑,客户可能只会看到一张图或者一个视频,既不可交互也不能改变视角。

借助Omniverse平台,设计师可以用流媒体的方式把设计程序,甚至整套流程串流到任何一个设备上。只需一台平板电脑/手机/上网本/轻型笔记本,就可以给客户进行演示,而且还可以得到实时反馈,让客户看到当前设计的状况,甚至可以利用AR/VR的方式让用户更真实的体验你所使用地应用程序。

如果Omniverse平台有RTX A6000显卡加持,会创造出什么样的画面呢?在NVIDIA刚刚放出来的夜间版《Marbles》便是这两者合体的杰作,施澄秋介绍:“视频中物体的摩擦、弹跳、互动,包括里面不同位置的声音全部由NVIDIA Ampere架构的技术来完成。该视频制作者来自超过12个团队,几十个工程师和设计师分散在全世界各个地方,实时利用NVIDIA Omniverse和NVIDIA RTX Ampere架构GPU完成了这一艺术创举。”

写在最后

在Turing架构推出三年之后,NVIDIA为大家带来了更加强悍的Ampere架构,让我们再一次感受到GPU性能的提升,而且二代RT Core、Tensor Core的引入对全新光线追踪和AI性能的加强也让其成为更出色的生产工具。

今年7月NVIDIA市值达到2513亿美元,首度超越Intel成为美国市值最高半导体公司,截止至目前,其市值更突破3000亿美元大关,在NVIDIA刚刚发布的第三季度财报中,创下收入47.3亿美元的记录。一个个记录随时间迁移不断被打破,未来还会发生什么?我们非常期待。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4940

    浏览量

    102815
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4700

    浏览量

    128700
  • Ampere
    +关注

    关注

    1

    文章

    64

    浏览量

    4533
收藏 人收藏

    评论

    相关推荐

    《算力芯片 高性能 CPUGPUNPU 微架构分析》第3篇阅读心得:GPU革命:从图形引擎到AI加速器的蜕变

    在数据挖掘工作中,我经常需要处理海量数据的深度学习任务,这让我对GPU架构和张量运算充满好奇。阅读《算力芯片》第7-9章,让我对这些关键技术有了全新认识。 GPU架构从早期的固定功能流
    发表于 11-24 17:12

    芯至科技与Ampere达成业务合作

    近日芯至科技与全球知名现代化半导体公司Ampere Computing达成BMC系统研发业务合作。
    的头像 发表于 11-07 13:46 183次阅读

    GPU服务器AI网络架构设计

    众所周知,在大型模型训练中,通常采用每台服务器配备多个GPU的集群架构。在上一篇文章《高性能GPU服务器AI网络架构(上篇)》中,我们对GPU
    的头像 发表于 11-05 16:20 196次阅读
    <b class='flag-5'>GPU</b>服务器AI网络<b class='flag-5'>架构</b>设计

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU

    本篇阅读学习第七、八章,了解GPU架构演进及CPGPU存储体系与线程管理 █从图形到计算的GPU架构演进 GPU图像计算发展 ●从三角形开始
    发表于 11-03 12:55

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    GPU、NPU,给我们剖析了算力芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解算力芯片。 全书共11章,由浅入深,较系统全面进行讲解。下面目录对全书内容有一个整体了解
    发表于 10-15 22:08

    【「大模型时代的基础架构」阅读体验】+ 未知领域的感受

    ”,好奇于这种大模型算力中心到底是如何建设的,用什么设备、什么架构建设的?对这些问题真是一无所知,甚至都没有想过,带着这份好奇开始阅读。 先浏览目录,共分十三章,目录中出现最多的就是GPU,比如机器学习
    发表于 10-08 10:40

    名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    的强有力竞争者;苹果、Cerebras、Ampere、特斯拉等企业的加入让这场“算力芯片战争”更加热闹。 CPU、GPU、NPU等芯片是推动科技创新的基石,算力的提升直接影响到产业的数字化转型和升级
    发表于 09-02 10:09

    GPU云服务器架构解析及应用优势

    GPU云服务器作为一种高性能计算资源,近年来在人工智能、大数据分析、图形渲染等领域得到了广泛应用。它结合了云计算的灵活性与GPU的强大计算能力,为企业和个人用户提供了一种高效、便捷的计算解决方案。下面我们将从架构解析和技术优势两
    的头像 发表于 08-14 09:43 325次阅读

    NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-26 11:25 588次阅读

    全新NVIDIA RTX A400和A1000 GPU全面加强AI设计与生产力工作流

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-18 10:29 487次阅读

    X-Silicon发布RISC-V新架构 实现CPU/GPU一体化

    X-Silicon 的芯片与其他架构不同,其设计将 CPU 和 GPU 的功能整合到单核架构中。这与英特尔和 AMD 的典型设计不同,前者有独立的 CPU 内核和 GPU 内核。
    发表于 04-08 11:34 541次阅读
    X-Silicon发布RISC-V新<b class='flag-5'>架构</b> 实现CPU/<b class='flag-5'>GPU</b>一体化

    FPGA在深度学习应用中或将取代GPU

    的玩家来说不是什么大问题。但在其他领域,如汽车行业,需要硬件有更高的耐用性,这就带来了问题。特别是过多的暴露在恶劣的环境中,再加上高强度的使用,GPU 的使用寿命将会更短。 Larzul 说:“从商
    发表于 03-21 15:19

    NVIDIA的Maxwell GPU架构功耗不可思议

    整整10年前的2013年2月19日,NVIDIA正式推出了新一代Maxwell GPU架构,它有着极高的能效,出场方式也非常特别。
    的头像 发表于 02-19 16:39 967次阅读
    NVIDIA的Maxwell <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>功耗不可思议

    深入解读AMD最新GPU架构

    GCN 取代了 Terascale,并强调 GPGPU 和图形应用程序的一致性能。然后,AMD 将其 GPU 架构开发分为单独的 CDNA 和 RDNA 线路,分别专门用于计算和图形。
    发表于 01-08 10:12 1147次阅读
    深入解读AMD最新<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>

    揭秘GPU: 高端GPU架构设计的挑战

    在计算领域,GPU(图形处理单元)一直是性能飞跃的代表。众所周知,高端GPU的设计充满了挑战。GPU架构创新,为软件承接大模型训练和推理场景的人工智能计算提供了持续提升的硬件基础。
    的头像 发表于 12-21 08:28 856次阅读
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>设计的挑战