0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPGPU研究框架及算力分析(2023)

架构师技术联盟 来源:架构师技术联盟 2023-03-28 11:20 次阅读

GPGPU的核心壁垒是高精度浮点计算及CUDA生态。从高精度浮点计算能力来看,国内GPU产品与国外产品的计算性能仍或有一代以上差距;在软件和生态层面与英伟达CUDA生态的差距则更为明显。

AI计算GPU领域,国内壁仞科技发布的BR100产品在FP32单精度计算性能上实现超越NVIDIA A100芯片,但是不支持FP64双精度计算;天数智芯推出的天垓100的FP32单精度计算性能实现超越A100芯片,但是在INT8整数计算性能方面却低于A100;海光推出的DCU实现了FP64双精度浮点计算,但是其性能为A100的60%左右,大概相当于其4年前水平。因此,从高精度浮点计算能力来看,国内GPU产品与国外产品的计算性能仍或有一代以上差距。

905026dc-cd0a-11ed-bfe3-dac502259ad0.jpg

但是,GPU不仅在硬件上需要提升算力,软件层面对于GPU的应用和生态布局尤其重要,英伟达凭借CUDA构建生态壁垒占领全球GPU市场90%的份额。目前国内企业多采用开源的OpenCL进行自主生态建设,但这需要大量的时间进行布局;

对比AMD从2013年开始建设GPU生态,近10年时间后用于通用计算的ROCm开放式软件平台才逐步有影响力,且还是在兼容CUDA的基础上。因此我们认为国内厂商在软件和生态层面与英伟达CUDA生态的差距较计算性能更为明显。

虽然目前国内产品的计算性能和软件生态实力与国际厂商还有差距,但是,国内厂商依然在奋起直追,努力实现GPGPU的国产化突破。

长久来看,美国对中国高端GPU的禁售令反而给国产GPGPU和AI芯片厂商带来快速发展的机会。

短期来看,我们认为对高端通用计算GPU的禁令可能会影响英伟达和AMD的GPU产品在中国的销售,中国AI计算、超级计算和云计算产业进步受到一定的阻碍。可使用英伟达和AMD还没有被禁止的及国产厂商的中高计算性能CPU、GPU、ASIC芯片等替代。

长期来看,国产CPU、GPU、AI芯片厂商受益于庞大的国内市场,叠加国内信创市场带来国产化需求增量,我们预期国内AI芯片的国产化比例将显著提升,借此机会进行产品升级,逐渐达到国际先进水平,突破封锁。

对于国内厂商,建议重点关注实现自主创新,打造自主生态体系,国内企业:

1)芯片:龙芯中科(国内PC CPU龙头,自主研发GPGPU产品)、海光信息(国内服务器CPU龙头,推出深度计算处理器DCU)、景嘉微(国内图形渲染GPU龙头)、寒武纪(国内ASIC芯片龙头)、澜起科技(国内服务器内存接口芯片龙头);

2)PCB:胜宏科技、兴森科技、沪电股份;

3)先进封装:通富微电、甬矽电子、长电科技、长川科技等。

海外企业:英伟达(全球GPU龙头)、AMD(全球CPU/GPU领先厂商)、英特尔(全球CPU龙头)、美光(全球存储芯片龙头)。

下载链接:

《143份重磅ChatGPT专业报告》

ChatGPT对GPU算力的需求测算与相关分析

906e2ca4-cd0a-11ed-bfe3-dac502259ad0.png

909328b0-cd0a-11ed-bfe3-dac502259ad0.png

91006d1c-cd0a-11ed-bfe3-dac502259ad0.png

9123bab0-cd0a-11ed-bfe3-dac502259ad0.png

91429fb6-cd0a-11ed-bfe3-dac502259ad0.png

91716800-cd0a-11ed-bfe3-dac502259ad0.png

919c0fa6-cd0a-11ed-bfe3-dac502259ad0.png

91bdd1a4-cd0a-11ed-bfe3-dac502259ad0.png

91d3c0b8-cd0a-11ed-bfe3-dac502259ad0.png

91ecb30c-cd0a-11ed-bfe3-dac502259ad0.png

9216f018-cd0a-11ed-bfe3-dac502259ad0.png

92502720-cd0a-11ed-bfe3-dac502259ad0.png

92689e54-cd0a-11ed-bfe3-dac502259ad0.png

9284f306-cd0a-11ed-bfe3-dac502259ad0.png

92eed1d6-cd0a-11ed-bfe3-dac502259ad0.png

9342c476-cd0a-11ed-bfe3-dac502259ad0.png

93626146-cd0a-11ed-bfe3-dac502259ad0.png

938b6da2-cd0a-11ed-bfe3-dac502259ad0.png

93b4861a-cd0a-11ed-bfe3-dac502259ad0.png

93ec2db8-cd0a-11ed-bfe3-dac502259ad0.png

9407e15c-cd0a-11ed-bfe3-dac502259ad0.png

946be5da-cd0a-11ed-bfe3-dac502259ad0.png

947bee12-cd0a-11ed-bfe3-dac502259ad0.png

94a7b510-cd0a-11ed-bfe3-dac502259ad0.png

94c2786e-cd0a-11ed-bfe3-dac502259ad0.png

94deac0a-cd0a-11ed-bfe3-dac502259ad0.png

953d58cc-cd0a-11ed-bfe3-dac502259ad0.png

95630efa-cd0a-11ed-bfe3-dac502259ad0.png

957b23e6-cd0a-11ed-bfe3-dac502259ad0.png

959b6674-cd0a-11ed-bfe3-dac502259ad0.png

95edfe5c-cd0a-11ed-bfe3-dac502259ad0.png

9617d16e-cd0a-11ed-bfe3-dac502259ad0.png

962c43f6-cd0a-11ed-bfe3-dac502259ad0.png

965a56ce-cd0a-11ed-bfe3-dac502259ad0.png

967edcb0-cd0a-11ed-bfe3-dac502259ad0.png

969563ea-cd0a-11ed-bfe3-dac502259ad0.png

96c0f23a-cd0a-11ed-bfe3-dac502259ad0.png

96fd860a-cd0a-11ed-bfe3-dac502259ad0.png

972aa64e-cd0a-11ed-bfe3-dac502259ad0.png

97510ef6-cd0a-11ed-bfe3-dac502259ad0.png

9770428a-cd0a-11ed-bfe3-dac502259ad0.png

97869f3a-cd0a-11ed-bfe3-dac502259ad0.png

979ecf60-cd0a-11ed-bfe3-dac502259ad0.png

97b553b6-cd0a-11ed-bfe3-dac502259ad0.png

97f00218-cd0a-11ed-bfe3-dac502259ad0.png

980caf9e-cd0a-11ed-bfe3-dac502259ad0.png

982d3a70-cd0a-11ed-bfe3-dac502259ad0.png

9849453a-cd0a-11ed-bfe3-dac502259ad0.png

986c94b8-cd0a-11ed-bfe3-dac502259ad0.png

988905ee-cd0a-11ed-bfe3-dac502259ad0.png

989c8038-cd0a-11ed-bfe3-dac502259ad0.png

98af1f18-cd0a-11ed-bfe3-dac502259ad0.png

98e32dda-cd0a-11ed-bfe3-dac502259ad0.png

990b2f24-cd0a-11ed-bfe3-dac502259ad0.png

992cd980-cd0a-11ed-bfe3-dac502259ad0.png

996016d8-cd0a-11ed-bfe3-dac502259ad0.png

997808c4-cd0a-11ed-bfe3-dac502259ad0.png

99ab75e2-cd0a-11ed-bfe3-dac502259ad0.png

99d15c6c-cd0a-11ed-bfe3-dac502259ad0.png

99f4f1ea-cd0a-11ed-bfe3-dac502259ad0.png

9a7fc428-cd0a-11ed-bfe3-dac502259ad0.png

9a925278-cd0a-11ed-bfe3-dac502259ad0.png

9aa96ee0-cd0a-11ed-bfe3-dac502259ad0.png

9ad5da7a-cd0a-11ed-bfe3-dac502259ad0.png

9aff9e3c-cd0a-11ed-bfe3-dac502259ad0.png

9b3b19e4-cd0a-11ed-bfe3-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    449

    文章

    48596

    浏览量

    413105
  • AI芯片
    +关注

    关注

    17

    文章

    1751

    浏览量

    34531
  • GPGPU
    +关注

    关注

    0

    文章

    24

    浏览量

    4826

原文标题:GPGPU研究框架及算力分析(2023)

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于队列的灵活状态机——WTYKAMC@2023框架

    本帖最后由 yk74110 于 2024-4-18 16:48 编辑 WTYKAMC@2023框架 【简介】 这是一个基于队列的灵活状态机,可以满足队列元素先进先出,先进后出,后进后出
    发表于 11-03 16:11

    能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解到,能RADXA微服务器的具体规格: 处理器:BM1684X :高达32Tops INT8峰值 内存:16GB L
    发表于 02-28 11:21

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    2023B报价】

    ,示波器,无线电综合测试仪,万用表,功率计,频率计,音视频分析仪等仪器,IFR2023B的产品简介:2023A/B和2025是经济型信号源,它们结构紧凑、重量轻、功能完备,可以满足各种层次的应用,包括
    发表于 01-15 17:47

    芯动a10pro 7g 750m_芯动a10pro_6g_720m 精选资料分享

    目前市场上炙手可热的芯片矿机 当数芯动 A10PRO , 7g 版本的 750m 功耗 1300w 这款机器厂家出厂时预定价格在 48900 左右那时候定的客户到如今 机器价格已经涨到
    发表于 07-23 07:39

    rx580,rx580显卡,rx588,rx588显卡 精选资料分享

    已下是rx580显卡9-11 Mh 没有开启计算模式,挖几分种重启自动开启,计算模式只支持WIN1022-28 Mh 原版BIOS,开启时序,并设置超频29-32 Mh 正常
    发表于 07-23 06:59

    数据、算法和其实现载体是什么

    背景介绍数据、算法和是人工智能技术的三大要素。其中,体现着人工智能(AI)技术具体实现的能力,实现载体主要有CPU、GPU、FPGA和ASIC四类器件。CPU基于冯诺依曼架构,
    发表于 07-26 06:47

    RK1808内置的NPU集成有何功能

    NPU集成有哪些特性呢?RK1808内置的NPU集成有何功能?
    发表于 02-16 07:52

    MXM 平台在边缘计算领域的应用

    , 继承了该接口的诸多优点,也更适合此类场景应用,为用户提供了一种边缘侧部署的解决方案,同时MXM接口还可以为用户提供其它架构模块搭配方案,如MXM界面的寒武纪
    发表于 05-18 15:52

    Xilinx Zynq7035指标

    目的本文介绍广州星嵌DSP C6657+Xilinx Zynq7035平台下Xilinx Zynq7035指标。基本概念FLOPs/FLOPSFLOPs,Floating Point
    发表于 12-15 21:19

    【新闻】2023年全国大学生物联网设计竞赛(华为杯)启动

    2023年3月中国高等教育学会发布了《2022全国普通高校大学生竞赛分析报告》,全国大学生物联网设计竞赛进入竞赛榜单。竞赛组委会将继续提高竞赛质量和影响,为物联网相关专业建设、国家战略性新兴产业
    发表于 03-24 09:33

    基于GIS的城市土地利用分析与建模框架研究_章欣欣

    基于GIS的城市土地利用分析与建模框架研究_章欣欣
    发表于 03-19 11:38 0次下载

    基于SSH框架的图书管理应用框架研究张敏

    基于SSH框架的图书管理应用框架研究_张敏
    发表于 03-17 08:00 0次下载

    详解GPGPU与人工智能

    GPGPU的最强性能,所有主流深度学习框架(Framework)都集成了这些算子库中的最少一个算子(cuDNN基本都有);
    的头像 发表于 05-18 11:12 3836次阅读

    CPU和GPGPU 未来的技术演变方向

    GPGPU 未来的技术演变方向。随着 GPGPU 在大数据处理、人工智能、商业计算领 域的广泛应用,呈现了以下发展趋势。
    发表于 12-08 20:41 686次阅读