0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型快速发展,GPU IP有何作用

Carol Li 来源:电子发烧友 作者:李弯弯 2024-05-29 00:05 次阅读


电子发烧友网报道(文/李弯弯)随着人工智能技术的快速发展,GPU作为重要的算力支撑时常被提及。国内外重要的GPU芯片公司也为人熟知,包括英伟达AMD英特尔,景嘉微、海光信息、天数智芯、摩尔线程等。

事实上,除此之外还有一些GPU IP公司也为GPU产业发展做出很大贡献,包括Imagination、Arm、芯原科技等。在当前备受关注的大模型方面,这些公司的产品也起到一定支持作用。

Imagination

Imagination的GPU IP产品包括IMG A系列、IMG CXT、IMG DXT等多个系列,每个系列有不同的特点和应用场景。IMG A系列,是Imagination有史以来性能最强大GPU IP产品,IMG A系列被设计为可应用于与各种场景的GPU,是多种垂直应用领域的终极解决方案。

该系列产品覆盖从入门级市场的每时钟周期处理1个像素(1 PPC)的组件,到高性能设备的速度高达每秒2万亿次浮点运算(2 TFLOP)的内核,以及针对云应用的、速度超越该数值的多核解决方案。

IMG CXT,搭载首个针对移动端优化的PowerVR Photon光线追踪架构,为移动端游戏玩家和开发者提供桌面级光线追踪功能的体验。实现了光线追踪性能的大幅提升,支持在移动设备中以高帧率实现逼真的光线追踪阴影、反射、全局照明和环境遮蔽等效果。

IMG DXT是新一代面向移动端的高性能GPU IP,为移动设备用户带来先进的图形技术。提供三款配置,包括DXT-8-256、DXT-48-1536和DXT-72-2304,分别针对主流、高端和旗舰移动设备。旗舰产品DXT-72-2304具有72 GTexels/s和2.5 TFLOP FP32算力,与上一代产品相比,其最大单核性能提升了50%。

Imagination的GPU IP产品广泛应用于移动设备、汽车、数据中心、桌面和云游戏等多个领域。通过提供高性能的图形渲染和数据处理能力,为各种应用场景提供了强大的支持。

Imagination的GPU IP高性能、可扩展性和低功耗的特性,使得在支持大模型的应用上具有优势。如IMG DXD,其多核配置提供了强大的计算能力,5 TFLOPS FP32和144 GTexel/s,能够在大模型的应用上起到支持作用。

Arm

Arm的GPU IP产品系列主要包括Mali系列和Immortalis系列。Mali系列GPU IP是Arm的长期主力产品,拥有从入门级到旗舰级的完整产品线。Mali系列包括Mali-G710、Mali-G610、Mali-G510、Mali-G310等多个型号,分别定位于不同性能和价格的市场段。

Mali系列GPU基于Valhall GPU架构,并持续优化和提升性能。例如,Mali-G710号称综合性能提升20%、机器学习性能提升35%、纹理性能提升50%、能效提升20%。

Immortalis系列是Arm在2022年推出的全新旗舰级GPU IP产品,旨在提供终极的移动3D体验。Immortalis GPU基于Mali设计,并引入了硬件光线追踪功能,这是首款在移动端支持此功能的GPU。

Immortalis GPU采用10-16核设计,性能比上一代Mali GPU高15%。其光线追踪单元旨在提高效率,只占用约4%的着色器核心面积,却能带来300%的性能提升。

目前,Immortalis系列已经推出了Immortalis-G715和Immortalis-G720等型号。Immortalis-G720是Arm目前性能和能效表现最为出色的GPU,与上一代产品相比,其性能和能效分别提高了15%,系统级效率更跃升了40%。

Arm的GPU IP产品广泛应用于移动设备、汽车、数据中心、桌面和云游戏等多个领域。它们能够支持各种计算任务,如图形渲染、物理模拟、图像处理、机器学习和人工智能等。

Arm的GPU IP高性能计算、能效优化和生态系统支持方面特点,使其在大模型的应用方面具有优势。Arm的GPU IP,如Mali系列和Ethos系列,已被多家公司采用,并成功应用于大模型训练和推理中。

在大模型训练方面,Arm的GPU IP被广泛应用于深度学习、自然语言处理等领域。通过与合作伙伴共同开发定制化的解决方案,Arm GPU IP为这些领域的研究者和开发者提供了强大的计算能力支持。

在云端推理方面,Arm的GPU IP同样发挥了重要作用。通过提供高性能的云端计算资源,Arm GPU IP支持了多种大模型应用的实时推理需求。

芯原股份

芯原股份的GPU IP系列产品,以其高性能、灵活性和广泛的应用范围,成为市场上备受瞩目的产品。芯原可扩展的Vivante图形处理器(GPU)IP系列应用广泛,包括从低功耗的小型物联网MCU到面向汽车和计算机应用的功能强大的SoC。设计可满足各种芯片尺寸和功耗预算,是具成本效益的优质图形处理器解决方案。

芯原科技此前还详细介绍了其GPGPU-AI IP为核心的AI芯片定制解决方案。其以Tensor Core和GPGPU/GPU为主,提供了一个灵活的架构。

芯原GPGPU-AI处理器上有芯原通用的软件栈,在上层可以支持标准的应用接口,下层可以适配芯原各种各样的算力IP,算力IP有图形处理器、并行计算处理器、神经网络处理器。芯原GPGPU-AI分几个层次扩展的算力,可以支持异构计算,包括矢量计算、标量计算和张量处理单元,还可以支持大模型,高带宽计算需求,同时基于在AI领域有多年的积累,可对数据组织、数据搬移和计算有针对性的优化,另外还有专门针对大模型的带宽压缩技术。

芯原的GPU IP已被广泛应用于桌面显卡、车载信息娱乐、工业显示、物联网及可穿戴设备、大规模并行计算等领域。

写在最后


可以看到,GPU IP在多个领域都有广泛应用,包括科学计算、大数据分析、深度学习和人工智能、游戏服务器、图像处理、图形渲染和动画制作、视频处理和图像识别等。

当然,GPU IP也在不断发展和演进中,未来,专用加速IP与通用GPU的融合或许是GPU技术未来发展的一个亮点,这种融合将使GPU更具多功能性,更好地处理特定工作负载。高速DRAM和缓存技术的不断演进也将推动GPU的性能提升,使其能够更有效地处理复杂的计算任务,如支持大模型的训练和部署。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4700

    浏览量

    128673
  • IP
    IP
    +关注

    关注

    5

    文章

    1642

    浏览量

    149323
  • 大模型
    +关注

    关注

    2

    文章

    2314

    浏览量

    2454
收藏 人收藏

    评论

    相关推荐

    PyTorch GPU 加速训练模型方法

    在深度学习领域,GPU加速训练模型已经成为提高训练效率和缩短训练时间的重要手段。PyTorch作为一个流行的深度学习框架,提供了丰富的工具和方法来利用GPU进行模型训练。 1. 了解
    的头像 发表于 11-05 17:43 439次阅读

    GPU市场趋势与未来发展

    随着科技的飞速发展,图形处理单元(GPU)已经成为现代计算领域不可或缺的一部分。从游戏到专业图形设计,再到人工智能和深度学习,GPU在各个领域都发挥着重要作用
    的头像 发表于 10-27 14:14 342次阅读

    GPU深度学习应用案例

    GPU在深度学习中的应用广泛且重要,以下是一些GPU深度学习应用案例: 一、图像识别 图像识别是深度学习的核心应用领域之一,GPU在加速图像识别模型训练方面发挥着关键
    的头像 发表于 10-27 11:13 324次阅读

    为什么ai模型训练要用gpu

    GPU凭借其强大的并行处理能力和高效的内存系统,已成为AI模型训练不可或缺的重要工具。
    的头像 发表于 10-24 09:39 190次阅读

    模型发展下,国产GPU的机会和挑战

    电子发烧友网站提供《大模型发展下,国产GPU的机会和挑战.pdf》资料免费下载
    发表于 07-18 15:44 6次下载
    大<b class='flag-5'>模型</b><b class='flag-5'>发展</b>下,国产<b class='flag-5'>GPU</b>的机会和挑战

    科普:GPU和FPGA,异同

    来源:内容由半导体行业观察(ID:icbank)编译自techspot,谢谢。图形处理单元(GPU)和现场可编程门阵列(FPGA)是用于成像和其他繁重计算的三种主要处理器类型中的两种。中央处理器
    的头像 发表于 06-15 08:27 609次阅读
    科普:<b class='flag-5'>GPU</b>和FPGA,<b class='flag-5'>有</b><b class='flag-5'>何</b>异同

    英伟达、AMD、英特尔GPU产品及优势汇总

    电子发烧友网报道(文/李弯弯)随着人工智能技术的快速发展GPU的市场规模在全球范围内持续提升。目前,GPU市场主要由英伟达、AMD和英特尔等几家大公司主导。其中,英伟达在AI
    的头像 发表于 05-10 00:59 4817次阅读

    模型时代,国产GPU面临哪些挑战

    电子发烧友网报道(文/李弯弯)随着人工智能技术的快速发展,对GPU计算能力的需求也越来越高。国内企业也正在不断提升GPU性能,以满足日益增长的应用需求。然而,相较于国际巨头,国内
    的头像 发表于 04-03 01:08 4591次阅读
    大<b class='flag-5'>模型</b>时代,国产<b class='flag-5'>GPU</b>面临哪些挑战

    国产GPU在AI大模型领域的应用案例一览

    电子发烧友网报道(文/李弯弯)近一年多时间,随着大模型发展GPU在AI领域的重要性再次凸显。虽然相比英伟达等国际大厂,国产GPU起步较晚、声势较小。不过近几年,国内不少
    的头像 发表于 04-01 09:28 3667次阅读
    国产<b class='flag-5'>GPU</b>在AI大<b class='flag-5'>模型</b>领域的应用案例一览

    盘点国产GPU在支持大模型应用方面的进展

    电子发烧友网报道(文/李弯弯)目前谈到GPU,大家首先想到的应该就是英伟达了。近一年多时间来,随着大模型发展,英伟达GPU的强大实力可谓无人不知。而相比之下,国产
    的头像 发表于 03-29 00:27 6059次阅读
    盘点国产<b class='flag-5'>GPU</b>在支持大<b class='flag-5'>模型</b>应用方面的进展

    FPGA在深度学习应用中或将取代GPU

    现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型时面临的许多问题 在过去的十年里,人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司的股价也大幅
    发表于 03-21 15:19

    什么是浪涌电阻器?浪涌电阻作用

    什么是浪涌电阻器?浪涌电阻作用? 浪涌电阻器也被称为浪涌保护器、浪涌抑制器或者防雷器,是一种用来保护电气系统和设备免受过电压和浪涌电流影响的装置。浪涌电阻器通常由金属氧化物(MOV)和其他材料
    的头像 发表于 02-02 16:17 1160次阅读

    光纤快速连接器作用?光纤快速连接器如何安装使用?

    光纤快速连接器作用?光纤快速连接器如何安装使用?与冷接子
    的头像 发表于 12-27 15:44 1356次阅读

    什么是静态IP地址?什么是DHCP?DHCP与静态IP到底区别呢?

    什么是静态IP地址?什么是DHCP?DHCP与静态IP到底区别呢?DHCP与静态IP地址哪个好? 静态
    的头像 发表于 12-27 14:09 6005次阅读

    什么是MPLS?特点?与SD-WAN区别?

    什么是MPLS?特点?与SD-WAN区别? MPLS是多协议标签交换的缩写,是一种网络传输协议。它被设计用于提高数据包转发的速度和效率,同时提供弹性和可靠性。MPLS通过为数据
    的头像 发表于 12-27 14:09 675次阅读