国内GPU厂商有各自的专注领域,其中不乏自主研发的产品,在IP、微架构创新、软硬件结合等方面均有建树。随着ChatGPT掀起AI热潮,大模型对算力的要求会越来越高,国内GPU厂商以图形处理、通用GPU(GPGPU)为根基,逐步涉足大模型应用,下面列举几家具有实力的国内GPU厂商。
登临科技
登临科技专注于高性能通用计算平台的芯片研发与技术创新,致力于打造云边端一体、软硬件协同、训练推理融合的前沿芯片产品和平台化基础系统软件。
基于GPGPU的软件定义的片内异构计算架构,登临科技自主研发了GPU+,在兼容CUDA/OpenCL在内的编程模型和软件生态的基础上,通过架构创新,完美解决了通用性和高效率的双重难题。大量客户产品实测证明,针对AI计算,GPU+相比传统GPU在性能尤其是能效上有显著提升。
图片来源:登临科技
登临科技GPU+架构经过优化,在基准测试中使得计算单元、片上内存的延迟可以做到30+ cycle,传统GPU为数百cycle。
采用“片上内存共享”技术,带宽仅为国际主流方案的五分之一到六分之一,带宽降低带来的好处是更高的能效比、更高的并行性。
此外,GPU+架构将计算密度和计算效率集中在矩阵单元,综合上述特性,基于登临科技GPU+架构的产品与国际旗舰产品相比,具有三到四倍单卡能效比优势。
图片来源:登临科技
在生态上,登临科技GPU+兼容国内外主流CPU、服务器,以及Network引擎,可有效降低用户的迁移成本。凭借创新的架构、独有的技术和完整的生态支持,面向生成式AI的应用和大模型发展浪潮,登临科技可提供强有竞争力的算力加速方案,全面助力用户产品的性能提升以及应用落地。
中微电科技
中微电科技专注GPU技术研发,GPU/显卡产品主要应用于信创市场、消费市场、人工智能、边缘计算等领域。中微电科技自主研发的指令集MVP ISA被工信部评定为“完全自主知识产权指令集”,成功进行多次基于MVP核的SoC芯片流片,取得处理器领域核心发明专利22项。
在“十四五”规划期间,中微电科技完成“南风”系列GPU芯片MVP核处理器架构、GPU核心自主知识产权IP、MVP指令集、编译器及软件栈等创新迭代升级及系统适配对接。完成“南风一号”量产、“南风二号”量产和“南风三号”预研,打造GPUIP级、芯片级和板块级产品,形成“自主+安全”的场景解决方案。
图片来源:中微电科技
中微电科技“南风一号”已于2022年完成流片,并于回片当天点亮成功。“南风一号”显卡已与长城信创台式机、麒麟操作系统、飞腾处理器、奇安信可信浏览器等完全兼容、运行稳定,性能满足党政、金融及安防等信创产业链专用整机电脑PC显卡需求。
通过“南风一号”成功点亮可以充分验证自研GPU IP满足桌面电脑显示的基本功能和性能要求。相对于授权IP受制于人,功能性能受限及产品同质化竞争的问题,自研IP不受任何第三方控制,可自主迭代发展,有望彻底解决卡脖子问题,打造自主GPU产业生态。只有坚持自主IP路线,深度的自研才能在产品和价格上形成竞争力,成为独特的IP护城河。
沐曦集成电路
沐曦集成电路(下文简称沐曦)专注于设计具有完全自主知识产权,针对异构计算等各类应用的高性能通用GPU芯片。首款异构GPU产品MXN100采用7nm制程,已于2022年8月回片点亮,主要应用于推理侧;应用于AI训练及通用计算的产品MXC500已于2022年12月交付流片,公司计划2024年全面量产。
沐曦拥有完全自主研发的GPU IP、指令集和架构,以及兼容主流GPU生态的完整软件栈(MXMACA),产品具备高能效、高通用性。目前已推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI训练及通用计算,以及MXG系列GPU(曦彩)用于图形渲染,可满足数据中心对高能效和高通用性的算力需求。
图注:沐曦产品系列。来源:沐曦、财通证券研究所
景嘉微
景嘉微研发了JM5400、JM7200、JM9为代表的系列图形处理芯片,目前正筹集资金用于“高性能通用GPU芯片研发及产业化项目”、“通用GPU先进架构研发中心建设项目”。
在技术储备方面,截至2022年12月31日,景嘉微共申请238项专利(193项国家发明专利、31项实用新型专利、10项国际专利、4项外观专利),较2021年同比增长16.10%,其中87项发明专利、29项实用新型专利、4项外观专利均已授权,登记了119项软件著作权,登记了2项集成电路布图。
图注:景嘉微GPU产品JM9规格
2022年公司围绕核心产品保持高研发投入,成功研发JM9系列第二款GPU芯片,并完成适配测试工作。2022年和1Q23受政策波动影响,市场需求萎缩,景嘉微产品销量减少。
景嘉微成长动力主要为算力需求有望拉动图形渲染GPU市场,进一步打开信创需求,对办公PC的GPU性能提出更高要求,推动独立显卡成为主流配置,信创GPU市场有望迎来扩容。同时随着数字化的发展,云游戏、数字孪生、元宇宙、工业数字化等产业成为高性能渲染GPU新的增长点。
图注:景嘉微业绩预测(来源:浙商证券研究所)
龙芯中科
龙芯中科掌握了处理器核及相关IP核设计的核心技术,是国内极少数使用自主架构研制通用处理器的企业。龙芯中科掌握指令系统、处理器核微结构、GPU以及各种接口IP等芯片核心技术,在关键技术上进行自主研发,拥有大量的自主知识产权,已取得专利400余项。龙芯指令系统和处理器IP核的关键技术已申请相关专利,相关处理器芯片也申请了集成电路布图设计版权。
图注:龙芯中科的核心技术(来源:龙芯中科招股书)
在显卡GPU驱动层面,根据龙芯系统架构的特点和优势,通过数据布局、传输通路、协作机制等优化手段,图形系统可充分释放GPU的性能潜力。在渲染库、解码库等基础图形库层面,结合龙芯CPU微结构和指令集的特点进行算法优化,从而推动整体系统性能的改善。
海光信息
海光信息同时具备CPU和DCU研发能力,在电信、金融、能源等重要行业领域实现订单放量。当前海光四号、海光五号CPU产品,以及深算二号、深算三号DCU(深度计算单元)产品研发进展顺利。
海光DCU系列产品以GPGPU架构为基础,兼容“类CUDA”环境,具备丰富软硬件生态,全面覆盖支持深度学习训练场景,满足AI、大数据处理、商业计算等高性能需求。深海一号DCU产品在典型应用场景下性能已达国际同类型产品同期水平,已经在北京大学高性能计算系统及百度飞桨AI大框架中应用落地,未来有望持续受益于AIGC时代算力需求爆发以及国产替代下的庞大市场。
图注:海光信息业绩预估
从消费应用到大模型,国内GPU如何突破?
目前实现商业化的国内GPU产品以消费应用居多,据Imagination中国区技术总监艾克介绍,消费应用的GPU和大模型中的GPU有所不同,国内GPU厂商要将技术和产品扩展到大模型应用,需要关注几点:
(1)技术研发:大规模GPU模型需要高性能的计算能力和大规模的数据存储能力,需要加强对GPU技术的研发力量,提升核心技术水平。包括研发GPU架构、设计和制造工艺的能力,提高芯片性能和功耗比,推动技术创新。
(2)创新应用:需要在新的应用领域进行创新,如人工智能、云计算、大数据,自动驾驶等。这些领域对计算能力的要求非常高,GPU可以提供并行计算能力,因此加强与这些领域的合作,推动GPU技术的应用。
(3)产业环境:需要打造良好的产业环境,吸引和培育GPU相关企业和人才。加大对GPU产业链关键环节的支持力度。同时,建立起完善的知识产权保护体系,保护自主研发成果。
(4)先进制造工艺:当前最先进制程和高GPU算力的设计,或受到美国出口技术的限制。如果国内先进制程技术能够获得突破,那么将十分利于国产GPU的发展。
图注:消费级GPU与大模型GPU的区别(来源:Imagination)
小结
海外厂商的发展过程有几个特点值得观察。首先,选择技术方向或许比快速展开业务更加重要。NVIDIA很早就意识到GPU在科学计算领域的潜力,并将其应用于人工智能、深度学习等领域。提前布局为未来趋势做好准备。
其次,持续进行微架构创新。NVIDIA始终保持着创新和领导地位,与不断研发新的GPU微架构和技术、提升性能和能效有较大关系。NVIDIA在GPU微架构上不断演进,推出了包括Tesla、Fermi、Kepler、Maxwell、Pascal、Volta、Turing、Ampere在内的架构,每一次微架构的创新涵盖了许多关键技术的引入和改进,推动了游戏图形性能的提升,也使得GPU在科学计算、人工智能等领域发挥了重要作用。
此外,国产GPU发展初期可以通过兼容CUDA的部分功能,快速拓展市场,降低开发难度和用户移植成本,但是长期来看,国内GPU厂商还是要不断提升自身的软硬件实力,打造一个自己的、独具特色的软硬件生态系统。
审核编辑黄宇
-
芯片
+关注
关注
455文章
50851浏览量
423879 -
gpu
+关注
关注
28文章
4742浏览量
128968 -
AI
+关注
关注
87文章
30946浏览量
269186
发布评论请先 登录
相关推荐
评论