0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU微架构及生态研究框架(2023)

架构师技术联盟 来源:架构师技术联盟 2023-07-09 10:55 次阅读

GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。国内GPU厂商纷纷大力投入研发快速迭代架构,推动产业开放构建自主生态,加速追赶全球头部企业。国产替代需求持续释放叠加国际局势不确定性加剧,AI&数据中心智能汽车、游戏等GPU需求有望高增,国产GPU迎来发展黄金期,我们看好国产GPU公司的发展与投资机遇。

第一,我们从性能和生态2个维度构建了GPU完整的研究体系。1)性能:决定GPU是否“高效”,其中微架构/制程是影响GPU性能的核心要素。2)生态:CUDA构筑通用计算坚固壁垒。

第二,提出在评估GPU性能的指标的重要性上:微架构、制程、流处理器数量、核心频率对GPU性能影响较大。我们详细梳理了GPU的微架构、制程、显存容量/位宽/带宽/频率、核心频率等各类性能参数及重要性程度,并利用“核心数*核心频率*2”公式对性能算力进行量化,揭示可用3DMark、MLPerf 等GPU软件跑分进行相关性能测试评估。

第三,详细拆解了NVIDIA Fermi和Hopper两大典型微架构的具体硬件实现,在顶点处理、光栅化计算、纹理贴图、像素处理的图形渲染流水线上对Fermi架构进行了拆分;在指令接收、调度、分配、计算执行的通用计算流水线上对Hopper架构进行了简单易懂的描述,并指明更多、更专、更智能等未来架构升级迭代的方向。

第四,明晰了生态是构建通用计算壁垒的基石。提出GPU研发难度在图形渲染硬件和通用计算软件生态层面,在IP、软件栈方面研发门槛较高,需要较长的积累,先发者优势明显。CUDA生态从2006年推出至今,经过不断发展完善,几乎已在行业生态内处于垄断地位。

第五,深度复盘Nvidia/AMD(ATI)的产品迭代和竞争发展史,通过对NVIDIA长期保持领先和AMD(ATI)反超进行总结得出结论:架构创新升级和新兴领域前瞻探索是领跑GPU行业的关键。

第六,梳理和测算了国内GPU在AI&数据中心、智能汽车、游戏行业的市场空间和发展趋势。

以下为报告原文,节选部分内容,更多内容请参看原报告“GPU研究框架(2023)”,以及“服务器基础知识全解(终极版)-182页PPT”,“服务器基础知识全解(终极版)-182页PDF”。


607bd42c-1ded-11ee-962d-dac502259ad0.png

60c56b32-1ded-11ee-962d-dac502259ad0.png

61e55220-1ded-11ee-962d-dac502259ad0.png

625485e6-1ded-11ee-962d-dac502259ad0.png

62aef526-1ded-11ee-962d-dac502259ad0.png

62d046cc-1ded-11ee-962d-dac502259ad0.png

6329c7e2-1ded-11ee-962d-dac502259ad0.png

63b6c840-1ded-11ee-962d-dac502259ad0.png

641ce6e8-1ded-11ee-962d-dac502259ad0.png

646b5800-1ded-11ee-962d-dac502259ad0.png

64e791ea-1ded-11ee-962d-dac502259ad0.png

6504cbde-1ded-11ee-962d-dac502259ad0.png

65379a5a-1ded-11ee-962d-dac502259ad0.png

656cbc4e-1ded-11ee-962d-dac502259ad0.png

65bd848a-1ded-11ee-962d-dac502259ad0.png

66344444-1ded-11ee-962d-dac502259ad0.png

66acc202-1ded-11ee-962d-dac502259ad0.png

6716a546-1ded-11ee-962d-dac502259ad0.png

6744b7ba-1ded-11ee-962d-dac502259ad0.png

67a659a2-1ded-11ee-962d-dac502259ad0.png

67dee434-1ded-11ee-962d-dac502259ad0.png

680e5462-1ded-11ee-962d-dac502259ad0.png

6874b6b2-1ded-11ee-962d-dac502259ad0.png

690c3212-1ded-11ee-962d-dac502259ad0.png

69814a48-1ded-11ee-962d-dac502259ad0.png

69de2628-1ded-11ee-962d-dac502259ad0.png

6a1329cc-1ded-11ee-962d-dac502259ad0.png

6a7a779e-1ded-11ee-962d-dac502259ad0.png

6b03de8a-1ded-11ee-962d-dac502259ad0.png

6b43685c-1ded-11ee-962d-dac502259ad0.png

6b7dced4-1ded-11ee-962d-dac502259ad0.png

6bc97780-1ded-11ee-962d-dac502259ad0.png

6c2c9a90-1ded-11ee-962d-dac502259ad0.png

6c6d063e-1ded-11ee-962d-dac502259ad0.png

6c89631a-1ded-11ee-962d-dac502259ad0.png

6cc9e322-1ded-11ee-962d-dac502259ad0.png

6d04e76a-1ded-11ee-962d-dac502259ad0.png

6d721326-1ded-11ee-962d-dac502259ad0.png

6de6331e-1ded-11ee-962d-dac502259ad0.png

6e1d5308-1ded-11ee-962d-dac502259ad0.png

6e4ec212-1ded-11ee-962d-dac502259ad0.png

6e983dc0-1ded-11ee-962d-dac502259ad0.png

6eff89d0-1ded-11ee-962d-dac502259ad0.png

6f720e38-1ded-11ee-962d-dac502259ad0.png

6fa62a38-1ded-11ee-962d-dac502259ad0.png

6fe7effe-1ded-11ee-962d-dac502259ad0.png

702e26f4-1ded-11ee-962d-dac502259ad0.png

7058dfca-1ded-11ee-962d-dac502259ad0.png

70d5eff6-1ded-11ee-962d-dac502259ad0.png

70fd79cc-1ded-11ee-962d-dac502259ad0.png

以上内容节选部分内容,更多内容请参看原报告“GPU研究框架(2023)”,以及“服务器基础知识全解(终极版)-182页PPT”,“服务器基础知识全解(终极版)-182页PDF”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4742

    浏览量

    128972
  • 智能汽车
    +关注

    关注

    30

    文章

    2857

    浏览量

    107300
  • 微架构
    +关注

    关注

    0

    文章

    22

    浏览量

    7045

原文标题:GPU微架构及生态研究框架(2023)

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    芯原发布新一代Vitality架构GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架构的图形处理器(GPU)IP系列。这一新一代GPU架构以其卓越的计算性能和广泛的应用领域,吸引了业界的广泛关注。 Vitality
    的头像 发表于 12-24 10:55 152次阅读

    《算力芯片 高性能 CPUGPUNPU 架构分析》第3篇阅读心得:GPU革命:从图形引擎到AI加速器的蜕变

    在数据挖掘工作中,我经常需要处理海量数据的深度学习任务,这让我对GPU架构和张量运算充满好奇。阅读《算力芯片》第7-9章,让我对这些关键技术有了全新认识。 GPU架构从早期的固定功能流
    发表于 11-24 17:12

    GPU服务器AI网络架构设计

    众所周知,在大型模型训练中,通常采用每台服务器配备多个GPU的集群架构。在上一篇文章《高性能GPU服务器AI网络架构(上篇)》中,我们对GPU
    的头像 发表于 11-05 16:20 371次阅读
    <b class='flag-5'>GPU</b>服务器AI网络<b class='flag-5'>架构</b>设计

    【「算力芯片 | 高性能 CPU/GPU/NPU 架构分析」阅读体验】--了解算力芯片GPU

    每个CUDA单元在 OpenCL 编程框架中都有对应的单元。 倒金字塔结构GPU存储体系 共享内存是开发者可配置的编程资源,使用门槛较高,编程上需要更多的人工显式处理。 在并行计算架构中,线程
    发表于 11-03 12:55

    【「算力芯片 | 高性能 CPU/GPU/NPU 架构分析」阅读体验】--全书概览

    GPU、NPU,给我们剖析了算力芯片的架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解算力芯片。 全书共11章,由浅入深,较系统全面进行讲解。下面目录对全书内容有一个整体了解
    发表于 10-15 22:08

    名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 架构分析

    追求单核心性能转向追求并行度,关注并研究算力芯片,这个方向是绝对没错的。这些年作者在自己所工作的量化金融行业取得的成绩有目共睹,他作为算力芯片的用户,熟悉芯片产品布局、逻辑单元构成、架构演变历程
    发表于 09-02 10:09

    名单公布!【书籍评测活动NO.41】大模型时代的基础架构:大模型算力中心建设指南

    基于TOGAF方法论,剖析业界知名案例的设计方案。 全书总计13章。第1章讲解AI与大模型时代对基础架构的需求;第2章讲解软件程序与专用硬件的结合,涉及GPU并行运算库、机器学习程序的开发框架和分布式AI训练
    发表于 08-16 18:33

    X-Silicon发布RISC-V新架构 实现CPU/GPU一体化

    X-Silicon 的芯片与其他架构不同,其设计将 CPU 和 GPU 的功能整合到单核架构中。这与英特尔和 AMD 的典型设计不同,前者有独立的 CPU 内核和 GPU 内核。
    发表于 04-08 11:34 591次阅读
    X-Silicon发布RISC-V新<b class='flag-5'>架构</b> 实现CPU/<b class='flag-5'>GPU</b>一体化

    FPGA在深度学习应用中或将取代GPU

    提供商外,英伟达还成立了专业的人工智能研究实验室。 不过,机器学习软件公司 Mipsology 的首席执行官兼联合创始人卢多维奇•拉祖尔 (Ludovic Larzul) 表示,GPU 还存在着一些缺陷
    发表于 03-21 15:19

    AI推理框架软件ONNX Runtime正式支持龙架构

    近日,知名AI推理框架开源社区ONNX Runtime正式发布支持龙架构的版本1.17.0。
    的头像 发表于 03-12 12:23 587次阅读
    AI推理<b class='flag-5'>框架</b>软件ONNX Runtime正式支持龙<b class='flag-5'>架构</b>

    GPU技术、生态及算力分析

    对比AMD从2013年开始建设GPU生态,近10年时间后用于通用计算的ROCm开放式软件平台才逐步有影响力,且还是在兼容CUDA的基础上。因此我们认为国内厂商在软件和生态层面与英伟达CUDA
    的头像 发表于 01-14 10:06 1269次阅读
    <b class='flag-5'>GPU</b>技术、<b class='flag-5'>生态</b>及算力分析

    OpenHarmony社区运营报告(2023年12月)

    隆重举行。作为开放原子开发者大会最重要的技术分论坛之一,此次论坛不仅展示了 2023 年 OpenHarmony 生态建设的成果,也透过多视角、多维度,探寻开启 OpenHarmony 技术创新和商业
    发表于 01-10 15:44

    gpu服务器评测

    随着科技的不断发展和进步,GPU服务器在大数据分析、深度学习、人工智能等领域正变得越来越重要。而超GPU服务器因其出色的性能和高度定制化的优势,成为了众多企业和研究机构的首选。本文将
    的头像 发表于 01-10 10:37 1400次阅读

    深入解读AMD最新GPU架构

    GCN 取代了 Terascale,并强调 GPGPU 和图形应用程序的一致性能。然后,AMD 将其 GPU 架构开发分为单独的 CDNA 和 RDNA 线路,分别专门用于计算和图形。
    发表于 01-08 10:12 1232次阅读
    深入解读AMD最新<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>

    华秋2023年度大事记~~

    、先楫半导体、国民技术等技术/企业生态圈,电子产业创新发展。 08-跨界融合 矩阵串联2023华秋持续深耕新媒体矩阵,布局信、抖音、B站、快手、今日头条等十余个主流新媒体平台,全媒体粉丝超过300
    发表于 01-05 10:59