0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

曙光已现!通用GPU芯片加速破局,国内企业突破量产瓶颈

Monika观察 来源:电子发烧友网 作者:莫婷婷 2022-03-08 07:23 次阅读

电子发烧友网报道(文/莫婷婷)当下,英伟达AMD两大巨头占据全球超过80%的通用GPU市场。在算力需求激增的情况下,多家国内企业选择加入通用GPU赛道,例如天数智芯、沐曦、壁仞科技、登临科技等。就在2021年3月,天数智芯发布全自研云端训练通用GPU芯片——天垓100芯片,这也是国内第一款全自研、GPU架构下的7nm制程通用GPU训练芯片。

电子发烧友网记者了解到,天数智芯的7nm 通用GPU训练芯片已经获得安防、人工智能、超算中心等多个应用领域的客户订单,未来将持续往5nm、3nm等更高级的制程发力。那么,国内通用GPU芯片量产的技术瓶颈在哪里,国内企业如何实现突围?记者就相关问题与天数智芯副总裁郭为进行了交流。

为什么国产通用GPU芯片量产难度大?

通用GPU即通用图形处理器,可用于人工智能模型训练与推理,以及高性能计算。与CPU相比,GPU的平行处理能力、处理速度都优于CPU,这也加强了GPU的通用性,而通用GPU的出现让GPU更加专注通用性。可以说,通用GPU就是GPU里的另一个快速发展的细分市场。

市场机构的数据显示,2019年我国通用GPU芯片的市场规模已达86亿元,预计到2025年将保持32%的年复合增长率,达458亿元。面对如此巨大的市场,国内企业涉足通用GPU市场,面临哪些挑战?郭为向记者表示,通用GPU芯片在设计上主要面临的是两大挑战,一是通用架构,二是软件生态。

在架构方面,通用架构需要适配各种各样的算法,包括基础计算;同时考虑到应用场景的特殊性,对芯片功耗也有要求,这就需要对芯片架构的优化和设计,实现低功耗高算力;另一方面,记者了解到国内在人才方面还面临较大的缺口,培养一位成熟的工程师需要10年的时间。

在软件生态方面,通用GPU不仅仅是一颗芯片硬件,还涉及到整个软件栈、编译器等一系列的软件生态系统。

为了突破技术瓶颈,天数智芯从2018年开始正式启动通用GPU芯片设计,历时三年最终量产国内首款全自研的7nm 通用GPU芯片。据了解,该芯片采用2.5D CoWoS晶圆封装技术,集成240亿晶体管,支持多精度数据类型支持标准/混合训练。在软件上,该芯片兼容主流生态系统,采用自主研发的软件栈,从多方面实现算力升级。

目前,一些国际巨头在GPU行业中仍处于领先位置,国内厂商需要突破重重挑战才能实现GPU突围。郭为也提到,英伟达经过十几年的发展,不仅有自主完善芯片架构,同样也有完善的软件生态,相对于软件生态,它具有丰富的软件接口、底层加速库,通用GPU芯片的入场门槛更高,这些都是国产企业需要追赶的。

正是因为通用GPU行业的高门槛,天数智芯的不易与成功也让国产企业看到了另一个可能性。

天数智芯推出7nm通用GPU芯片时便得到了业内人士的认可。中国工程院院士倪光南表示,该芯片在性能指标方面并不亚于国外主流产品。电子发烧友网了解到,天数智芯的“天垓100芯片”比业内同类芯片的面积小了一半,却实现单精FP32性能37TFlops,半精FP16/BF16性能147TFlops。

国产通用GPU芯片落地,深挖应用场景

国产通用GPU芯片在AI领域将打开大规模的应用市场,而这些都需要云端训练。以安防摄像头为例,摄像头在工作过程中,需要进行车辆识别、人脸识别等,这部分更重要的是依赖云端训练出的模型,进行大量推理。

郭为提到,通用GPU芯片还可以用于安检机,以及快递行业,对大量的物品进行识别,不管是安防还是快递行业,这些行业对模型训练以及模型推理的速度要求都非常高。在这方面,天数智芯已有客户带来了落地应用案例。

通用GPU芯片最典型的应用场景是在人工智能,但随着技术的成熟,通用GPU芯片在5G自动驾驶、大数据等领域的应用不断扩增。

自动驾驶最重要的是安全性,车上有大量的传感器获取路面情况,这些数据将被整合,再通过预先训练的模型预测路况,可以迅速作出决定。郭为指出,在这个过程中,需要大量的算力,同时考虑到汽车空间、电池功耗等问题,将大功耗或者大算力系统放在汽车内部也不太适合,最值得考虑的解决方案是将系统放在边缘侧,同时因为它需要迅速作出决定,要求边缘侧和汽车之间的通讯尽量地做到低时延,5G恰好可以实现这样的低时延。

在这些处理过程中,都需要用到通用GPU芯片。郭为认为,在达到理想的高算力低功耗的技术下,未来可以把高端的高算力的芯片直接放在汽车上面,应用场景也就更广了,这也是未来几年业内的研究方向。

对于未来的发展战略,天数智芯副总裁郭为提到了三大方面:

一是更强的算力。任何一个AI应用的模型都会越来越复杂,要求提供更高的算力,同时芯片制成提升会带来边际效应收窄,这时该如何进一步提升算力,实际上是任何一个通用GPU芯片都会面临的技术挑战。另一方面,自动驾驶、智慧医疗等各个行业的算法也在不断演进,此时,对于训练芯片来讲,更高的算力才能支持相应的算法运行。

二是更高的通用性。由于技术的快速迭代,云端训练芯片一定要有更高的通用性才能跟上智能驾驶、智慧医疗等高端市场需求。

三是隐私计算。智慧医疗场景涉及到患者,甚至医院的医疗数据隐私。而任何一个AI模型都需要大量的数据做训练,这时需要用到隐私计算,通过隐私加解密的方式,让这些敏感的数据做到可用。

“对于医疗这样的场景,隐私保护是相当重要的。云端训练芯片关于隐私保护这部分的解决方案,以及通用计算,也应当是后面的发展趋势。”郭为表示,天数智芯在未来会深挖隐私保护的相关应用场景,并且推出解决方案。

小结

如今,国内企业不断发力通用GPU芯片市场,随着技术的成熟也将给更多的应用场景带来多样化的可能性。当然,国内企业还需正视与国际企业的差距,并且在追赶的过程中,不断缩小差距,让国内的通用GPU芯片打开真正的用武之地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29946

    浏览量

    268246
  • GPU芯片
    +关注

    关注

    1

    文章

    303

    浏览量

    5773
  • 天数智芯
    +关注

    关注

    0

    文章

    94

    浏览量

    5526
收藏 人收藏

    评论

    相关推荐

    GPU加速计算平台是什么

    GPU加速计算平台,简而言之,是利用图形处理器(GPU)的强大并行计算能力来加速科学计算、数据分析、机器学习等复杂计算任务的软硬件结合系统。
    的头像 发表于 10-25 09:23 200次阅读

    英伟达Blackwell GPU量产加速,Q4营收冲刺百亿美元大关

    近日,全球领先的图形处理单元(GPU)及人工智能芯片制造商英伟达传来重大利好消息。据摩根士丹利最新发布的行业分析报告指出,英伟达基于Blackwell架构的新一代GPU已成功进入量产
    的头像 发表于 09-26 15:58 287次阅读

    名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    纸质媒体的高质量和专业网络媒体的信息更新速度。 算力芯片在最近15年有着巨大性能突破,这些年Intel的CPU芯片从双核128位SIMD到众核512位SIMD;NVIDIA的GPU产品
    发表于 09-02 10:09

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    ,得到了华为、腾讯、优必选、中煤科工、中国联通、云天励飞、考拉悠然、智航、力维智联等国内人工智能企业的深度参与和大力支持。 报名后即可到现场领取礼品,总计5000份,先到先选! 点击报名:https://bbs.elecfans.com/jishu_2447254_1
    发表于 08-22 15:00

    国产芯片原厂的出路:从风潮到现实的之路

    国产芯片原厂的出路:从风潮到现实的之路
    的头像 发表于 08-12 17:54 560次阅读

    1200V GaN又有新玩家入场,进入量产

    电子发烧友网报道(文/梁浩斌)最近,又有国内GaN厂商成功突破1200V GaN器件技术。7月26日,宇腾科技在社交平台上宣布公司自主研发生产的蓝宝石基GaN功率器件工作电压达到1200V,进入
    的头像 发表于 07-31 01:06 3346次阅读

    摩尔线程与国内EDA企业合作加速GPU芯片设计

    7月19日,摩尔线程公司正式宣布与国内EDA(电子设计自动化)领域的领军企业缔结战略伙伴关系,此举标志着双方在推动中国半导体设计核心技术自主化进程上迈出了坚实步伐。EDA,被誉为半导体行业的“基石”,其全球市场份额长期由欧美三强主导,而
    的头像 发表于 07-19 14:48 1697次阅读

    中科微感MEMS气体传感器量产技术再次突破瓶颈,良品率接近98%

    中科微感MEMS气体传感器量产技术再次突破瓶颈。以CM-A107S氢气传感器为例,晶圆级万颗批量生产,单颗LGA封装的MEMS氢气传感器初始阻值和响应值一致性偏差逼近5%,良品率接近98%。
    的头像 发表于 05-09 09:03 577次阅读
    中科微感MEMS气体传感器<b class='flag-5'>量产</b>技术再次<b class='flag-5'>突破</b><b class='flag-5'>瓶颈</b>,良品率接近98%

    国内GPU新势力:能否成为英伟达的“终结者”?

    在当今的信息技术时代,图形处理器(GPU)和人工智能(AI)加速卡在计算领域中扮演着至关重要的角色。英伟达(NVIDIA),作为全球GPU和AI技术的领军企业,长期以来一直占据着市场的
    的头像 发表于 04-24 11:07 420次阅读
    <b class='flag-5'>国内</b><b class='flag-5'>GPU</b>新势力:能否成为英伟达的“终结者”?

    FPGA芯片你了解多少?

    ,FPGA芯片未来五年势必会迎来加速放量期,尽管国内企业和世界顶级企业还有较大差距,但在国产替代的核心逻辑下,摘取低处的果实也足以吃饱,不出
    发表于 04-17 11:13

    未来来,多传感器融合感知是自动驾驶的关键

    方面表示,这是L4级自动驾驶公司和车企为了打造Robotaxi量产车,在国内成立的首个合资公司。首款车型已完成产品定义,正在进行设计造型的联合评审,计划明年实现量产。未来来,2024
    发表于 04-11 10:26

    国内首枚!合肥造量子芯片重大突破

    记者3月19日从合肥中安创谷科技园获悉,位于该园的合肥硅臻芯片研发的量子随机数发生器芯片QRNG-10,日前通过了国家密码管理商用密码检测中心的密码检测。 这是国内第一枚
    的头像 发表于 03-21 08:42 540次阅读
    <b class='flag-5'>国内</b>首枚!合肥造量子<b class='flag-5'>芯片</b>重大<b class='flag-5'>突破</b>

    Nvidia与AMD新芯片突破PCIe瓶颈

    AMD 和 Nvidia 的 GPU 都依赖 PCI 总线与 CPU 进行通信。CPU 和 GPU 有两个不同的内存域,数据必须通过 PCI 接口从 CPU 域移动到 GPU 域(并返回)。
    的头像 发表于 03-08 14:15 585次阅读
    Nvidia与AMD新<b class='flag-5'>芯片</b>,<b class='flag-5'>突破</b>PCIe<b class='flag-5'>瓶颈</b>

    新入围企业翻倍 芯片电感助力磁性元件

    2023年,新能源整个产业也加入了价格战的厮杀,日益激烈的竞争,让越来越多的企业开始将目光投向技术,希望以技术过渡内卷的行业现状,本届优霸杯入围企业数量相比往届大幅增加,就是这一现
    的头像 发表于 01-25 15:14 461次阅读
    新入围<b class='flag-5'>企业</b>翻倍 <b class='flag-5'>芯片</b>电感助力磁性元件<b class='flag-5'>破</b>卷

    文心一言用户规模1亿 应用突破4000款

    ,文心一言用户规模1亿。基于文心一言的应用突破4000款。百度文心大模型调用量已达国内首位。 王海峰表示将继续与所有开发者携手并肩,在飞桨和文心的支持下,共赴
    的头像 发表于 12-28 18:18 1043次阅读