0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型快速发展,GPU IP有何作用

Carol Li 来源:电子发烧友 作者:李弯弯 2024-05-29 00:05 次阅读


电子发烧友网报道(文/李弯弯)随着人工智能技术的快速发展,GPU作为重要的算力支撑时常被提及。国内外重要的GPU芯片公司也为人熟知,包括英伟达AMD英特尔,景嘉微、海光信息、天数智芯、摩尔线程等。

事实上,除此之外还有一些GPU IP公司也为GPU产业发展做出很大贡献,包括Imagination、Arm、芯原科技等。在当前备受关注的大模型方面,这些公司的产品也起到一定支持作用。

Imagination

Imagination的GPU IP产品包括IMG A系列、IMG CXT、IMG DXT等多个系列,每个系列有不同的特点和应用场景。IMG A系列,是Imagination有史以来性能最强大GPU IP产品,IMG A系列被设计为可应用于与各种场景的GPU,是多种垂直应用领域的终极解决方案。

该系列产品覆盖从入门级市场的每时钟周期处理1个像素(1 PPC)的组件,到高性能设备的速度高达每秒2万亿次浮点运算(2 TFLOP)的内核,以及针对云应用的、速度超越该数值的多核解决方案。

IMG CXT,搭载首个针对移动端优化的PowerVR Photon光线追踪架构,为移动端游戏玩家和开发者提供桌面级光线追踪功能的体验。实现了光线追踪性能的大幅提升,支持在移动设备中以高帧率实现逼真的光线追踪阴影、反射、全局照明和环境遮蔽等效果。

IMG DXT是新一代面向移动端的高性能GPU IP,为移动设备用户带来先进的图形技术。提供三款配置,包括DXT-8-256、DXT-48-1536和DXT-72-2304,分别针对主流、高端和旗舰移动设备。旗舰产品DXT-72-2304具有72 GTexels/s和2.5 TFLOP FP32算力,与上一代产品相比,其最大单核性能提升了50%。

Imagination的GPU IP产品广泛应用于移动设备、汽车、数据中心、桌面和云游戏等多个领域。通过提供高性能的图形渲染和数据处理能力,为各种应用场景提供了强大的支持。

Imagination的GPU IP高性能、可扩展性和低功耗的特性,使得在支持大模型的应用上具有优势。如IMG DXD,其多核配置提供了强大的计算能力,5 TFLOPS FP32和144 GTexel/s,能够在大模型的应用上起到支持作用。

Arm

Arm的GPU IP产品系列主要包括Mali系列和Immortalis系列。Mali系列GPU IP是Arm的长期主力产品,拥有从入门级到旗舰级的完整产品线。Mali系列包括Mali-G710、Mali-G610、Mali-G510、Mali-G310等多个型号,分别定位于不同性能和价格的市场段。

Mali系列GPU基于Valhall GPU架构,并持续优化和提升性能。例如,Mali-G710号称综合性能提升20%、机器学习性能提升35%、纹理性能提升50%、能效提升20%。

Immortalis系列是Arm在2022年推出的全新旗舰级GPU IP产品,旨在提供终极的移动3D体验。Immortalis GPU基于Mali设计,并引入了硬件光线追踪功能,这是首款在移动端支持此功能的GPU。

Immortalis GPU采用10-16核设计,性能比上一代Mali GPU高15%。其光线追踪单元旨在提高效率,只占用约4%的着色器核心面积,却能带来300%的性能提升。

目前,Immortalis系列已经推出了Immortalis-G715和Immortalis-G720等型号。Immortalis-G720是Arm目前性能和能效表现最为出色的GPU,与上一代产品相比,其性能和能效分别提高了15%,系统级效率更跃升了40%。

Arm的GPU IP产品广泛应用于移动设备、汽车、数据中心、桌面和云游戏等多个领域。它们能够支持各种计算任务,如图形渲染、物理模拟、图像处理、机器学习和人工智能等。

Arm的GPU IP高性能计算、能效优化和生态系统支持方面特点,使其在大模型的应用方面具有优势。Arm的GPU IP,如Mali系列和Ethos系列,已被多家公司采用,并成功应用于大模型训练和推理中。

在大模型训练方面,Arm的GPU IP被广泛应用于深度学习、自然语言处理等领域。通过与合作伙伴共同开发定制化的解决方案,Arm GPU IP为这些领域的研究者和开发者提供了强大的计算能力支持。

在云端推理方面,Arm的GPU IP同样发挥了重要作用。通过提供高性能的云端计算资源,Arm GPU IP支持了多种大模型应用的实时推理需求。

芯原股份

芯原股份的GPU IP系列产品,以其高性能、灵活性和广泛的应用范围,成为市场上备受瞩目的产品。芯原可扩展的Vivante图形处理器(GPU)IP系列应用广泛,包括从低功耗的小型物联网MCU到面向汽车和计算机应用的功能强大的SoC。设计可满足各种芯片尺寸和功耗预算,是具成本效益的优质图形处理器解决方案。

芯原科技此前还详细介绍了其GPGPU-AI IP为核心的AI芯片定制解决方案。其以Tensor Core和GPGPU/GPU为主,提供了一个灵活的架构。

芯原GPGPU-AI处理器上有芯原通用的软件栈,在上层可以支持标准的应用接口,下层可以适配芯原各种各样的算力IP,算力IP有图形处理器、并行计算处理器、神经网络处理器。芯原GPGPU-AI分几个层次扩展的算力,可以支持异构计算,包括矢量计算、标量计算和张量处理单元,还可以支持大模型,高带宽计算需求,同时基于在AI领域有多年的积累,可对数据组织、数据搬移和计算有针对性的优化,另外还有专门针对大模型的带宽压缩技术。

芯原的GPU IP已被广泛应用于桌面显卡、车载信息娱乐、工业显示、物联网及可穿戴设备、大规模并行计算等领域。

写在最后


可以看到,GPU IP在多个领域都有广泛应用,包括科学计算、大数据分析、深度学习和人工智能、游戏服务器、图像处理、图形渲染和动画制作、视频处理和图像识别等。

当然,GPU IP也在不断发展和演进中,未来,专用加速IP与通用GPU的融合或许是GPU技术未来发展的一个亮点,这种融合将使GPU更具多功能性,更好地处理特定工作负载。高速DRAM和缓存技术的不断演进也将推动GPU的性能提升,使其能够更有效地处理复杂的计算任务,如支持大模型的训练和部署。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4508

    浏览量

    127532
  • IP
    IP
    +关注

    关注

    5

    文章

    1431

    浏览量

    148521
  • 大模型
    +关注

    关注

    2

    文章

    1871

    浏览量

    1497
收藏 人收藏

    评论

    相关推荐

    模型发展下,国产GPU的机会和挑战(下)

    洞见分析经验分享模型
    电子发烧友网官方
    发布于 :2024年06月11日 17:15:23

    模型发展下,国产GPU的机会和挑战(上)

    洞见分析经验分享模型
    电子发烧友网官方
    发布于 :2024年06月11日 16:51:11

    模型时代,国产GPU面临哪些挑战

    电子发烧友网报道(文/李弯弯)随着人工智能技术的快速发展,对GPU计算能力的需求也越来越高。国内企业也正在不断提升GPU性能,以满足日益增长的应用需求。然而,相较于国际巨头,国内
    的头像 发表于 04-03 01:08 4016次阅读
    大<b class='flag-5'>模型</b>时代,国产<b class='flag-5'>GPU</b>面临哪些挑战

    国产GPU在AI大模型领域的应用案例一览

    电子发烧友网报道(文/李弯弯)近一年多时间,随着大模型发展GPU在AI领域的重要性再次凸显。虽然相比英伟达等国际大厂,国产GPU起步较晚、声势较小。不过近几年,国内不少
    的头像 发表于 04-01 09:28 2922次阅读
    国产<b class='flag-5'>GPU</b>在AI大<b class='flag-5'>模型</b>领域的应用案例一览

    盘点国产GPU在支持大模型应用方面的进展

    电子发烧友网报道(文/李弯弯)目前谈到GPU,大家首先想到的应该就是英伟达了。近一年多时间来,随着大模型发展,英伟达GPU的强大实力可谓无人不知。而相比之下,国产
    的头像 发表于 03-29 00:27 3761次阅读
    盘点国产<b class='flag-5'>GPU</b>在支持大<b class='flag-5'>模型</b>应用方面的进展

    FPGA在深度学习应用中或将取代GPU

    现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型时面临的许多问题 在过去的十年里,人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司的股价也大幅
    发表于 03-21 15:19

    嘉楠基于RISC-V的端侧AIoT SoC采用了芯原的ISP IPGPU IP

    信号处理器(ISP)IP ISP8000、畸变矫正(DeWarp)处理器IP DW200,以及2.5D图形处理器(GPUIP GCNanoV。该合作极大地优化了高精度、低延迟的端侧A
    的头像 发表于 03-14 10:20 296次阅读

    嘉楠基于RISC-V的端侧AIoT SoC采用了芯原的ISP IPGPU IP

    了芯原的图像信号处理器 (ISP) IP ISP8000、畸变矫正 (DeWarp) 处理器IP DW200,以及2.5D图形处理器 (GPU) IP GCNanoV。
    的头像 发表于 03-14 09:03 255次阅读

    芯原2.5D GPU IP赋能先楫HPM6800系列RISC-V MCU

    了芯原在嵌入式GPU IP领域的领先地位,也进一步推动了RISC-V MCU在高性能图形处理领域的应用发展
    的头像 发表于 03-07 11:47 706次阅读

    pytorch模型转换需要注意的事项哪些?

    和记录张量上的操作,不会记录任何控制流操作。 为什么不能是GPU模型? 答:BMNETP的编译过程不支持。 如何将GPU模型转成CPU模型
    发表于 09-18 08:05

    国产GPU打造强大算力底座,天数智芯助力大模型创新发展

    模型落地实践》的主题演讲,深入介绍了天数智芯通用GPU产品以及自主算力解决方案,为大模型创新发展打造坚实算力底座。 天数智芯副总裁郭为 郭为指出,大
    的头像 发表于 09-07 17:15 753次阅读
    国产<b class='flag-5'>GPU</b>打造强大算力底座,天数智芯助力大<b class='flag-5'>模型</b>创新<b class='flag-5'>发展</b>

    GPU上OpenVINO基准测试的推断模型的默认参数与CPU上的参数不同是为什么?

    在 CPU 和 GPU 上推断出具有 OpenVINO™ 基准的相同模型: benchmark_app.exe -m model.xml -d CPU benchmark_app.exe -m
    发表于 08-15 06:43

    TCP/IP协议是什么?TCP/IP参考模型的结构是怎样的?

    TCP/IP协议组在OSI模型之前流行。最初的TCP/IP有四层,显然与OSI模型的层不匹配。当OSI模型被引入时,人们相信它将在商业上压倒
    的头像 发表于 08-11 15:26 1904次阅读
    TCP/<b class='flag-5'>IP</b>协议是什么?TCP/<b class='flag-5'>IP</b>参考<b class='flag-5'>模型</b>的结构是怎样的?

    用于快速模型模型调试器11.20版用户指南

    用于快速模型模型调试器是用于可扩展集群软件开发的完全可重定目标的调试器。它旨在满足SoC软件开发人员的需求。 Model Debugger具有易于使用的GUI前端,并支持: •源代码级调试
    发表于 08-10 06:33

    用于快速模型模型调试器11.21版用户指南

    用于快速模型模型调试器是用于可扩展集群软件开发的完全可重定目标的调试器。它旨在满足SoC软件开发人员的需求。 Model Debugger具有易于使用的GUI前端,并支持: •源代码级调试
    发表于 08-09 07:57