高通：未来几个月有望在终端侧运行超100亿参数的模型-电子发烧友网

电子发烧友网报道（文/李弯弯）日前，在2023世界半导体大会暨南京国际半导体博览会上，高通全球副总裁孙刚发表演讲时谈到，目前高通能够支持参数超过10亿的模型在终端上运行，未来几个月内超过100亿参数的模型将有望在终端侧运行。

大模型在终端侧运行的重要性

生成式AI正在快速发展，数据显示，2020年至2022年，生成式AI相关的投资增长425%，初步预估生成式AI市场规模将达到1万亿美元。

然而孙刚指出，云经济难以支持生成式AI规模化拓展，为实现规模化拓展，AI处理的中心正在向边缘转移。比如XR、汽车、手机、PC、物联网，生成式AI将影响各类终端上的应用。

高通在这方面展示出了领先的优势，高通AI引擎由多个硬件和软件组件组成，用于在骁龙移动平台上为终端侧AI推理加速。它采用异构计算架构，包括高通Hexagon处理器、Adreno GPU、Kryo CPU和传感器中枢，共同支持在终端上运行AI应用程序。

在7月初的2023年世界人工智能大会上，高通就已经展示了全球首个在终端侧运行生成式AI（AIGC）模型Stable Diffusion的技术演示，和全球最快的终端侧语言-视觉模型（LVM）ControlNet运行演示。这两款模型的参数量已经达到10亿-15亿，仅在十几秒内就能够完成一系列推理，根据输入的文字或图片生成全新的AI图像。

今年7月18日，Meta官宣将发布其开源大模型LLaMA的商用版本，为初创企业和其他企业提供了一个强大的免费选择，以取代OpenAI和谷歌出售的昂贵的专有模型。随后，高通发布公告称，从2024年起，Llama 2将能在旗舰智能手机和PC上运行。

高通技术公司高级副总裁兼边缘云计算解决方案业务总经理Durga Malladi表示，为了有效地将生成式人工智能推广到主流市场，人工智能将需要同时在云端和边缘终端（如智能手机、笔记本电脑、汽车和物联网终端）上运行。

在高通看来，和基于云端的大语言模型相比，在智能手机等设备上运行Llama 2 等大型语言模型的边缘云计算具有许多优势，不仅成本更低、性能更好，还可以在断网的情况下工作，而且可以提供更个性化、更安全的AI服务。

如何让大模型在终端规模化扩展

生成式AI进入未来生活的趋势已经不可阻挡，为了让生成式AI规模化扩展到更多终端设备中，高通提出了混合AI架构的运行方式，即在云端和设备终端的边缘侧之间分配算力，协同处理AI工作负载。

所谓混合AI，是指充分利用边缘侧终端算力支持生成式AI应用的方式，相比仅在云端运行的AI，前者能够带来高性能、个性化且更安全的体验。

比如，如果模型、提示或生成内容的长度小于某个限定值，且精度足够，推理就可以完全在终端侧进行；如果任务相对复杂，则可以部分依靠云端模型；如果需要更多实时内容，模型也可以接入互联网获取信息。

在未来，不同的生成式AI用不同分流方式的混合AI架构，AI也能在此基础上持续演进：
‍大量生成式AI的应用，比如图像生成或文本创作，需求AI能够进行实时响应。在这种任务上，终端可通过运行不太复杂的推理完成大部分任务。

在AI计算的实现上，软件和硬件同样重要，因为必须在端侧做到运算更快，效率更高，并推动AI应用在广泛终端上的部署和普及。

高通在2022年6月推出AI软件栈（Qualcomm AI Stack），其支持包括TensorFlow、Pytorch和ONNX在内的所有主流开发框架，所有runtimes（运行时，即某门编程语言的运行环境）和操作系统。借助高通AI软件栈，开发者在智能手机领域开发的软件可以快速扩展至汽车、XR、可穿戴设备等其他产品线进行使用。

高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar表示，未来公司需要加大终端侧技术上的研发，尤其是进一步提升量化的算法。例如服务器上训练的模型一般采用32位浮点运算（FP32），而我们在手机端现在能够支持INT4计算，这能大大提高端侧的处理能力。

小结

不仅仅是大模型的训练需要极大的算力和功耗，部署也同样如此。如果要让大模型在更多的领域实现落地应用，除了在云端部署之后，在终端侧部署也很关键。目前已经有诸多厂商在该领域进行探索，包括高通，期待未来大模型能够走进人们生活的方方面面。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

高通

高通

+关注

关注
76

文章
7459

浏览量
190557

讯飞星火端侧模型发布

参数量小、内存占比小的端侧模型，正成为“兵家必争之地”。

发表于 12-04 16:07 •741次阅读

李彦宏宣布：百度文心大模型日调用量超15亿

和深远影响。李彦宏在演讲中透露，百度文心大模型在过去半年内实现了惊人的增长，日均调用量从几个月前的2亿次迅速攀升至15亿次，增长率高达7.5倍。这一增长趋势不仅超出了百度内部的预期，

发表于 11-12 10:40 •201次阅读

航天级100krad 100V高侧电流检测电路

电子发烧友网站提供《航天级100krad 100V高侧电流检测电路.pdf》资料免费下载

发表于 09-07 09:57 •0次下载

航天级<b class='flag-5'>100</b>krad <b class='flag-5'>100</b>V<b class='flag-5'>高</b><b class='flag-5'>侧</b>电流检测电路

英伟达震撼发布:全新AI模型参数规模跃升至80亿量级

8月23日，英伟达宣布，其全新AI模型面世，该模型参数规模高达80亿，具有精度高、计算效益大等优势，适用于GPU加速的数据中心、云及工作站环

发表于 08-23 16:08 •729次阅读

新火种AI 月之暗面再获融资！200亿估值，中国模型公司新宠儿？

美元，约合236亿人民币，一举跃过“200亿门槛”。有意思的是，获得新融资的不仅仅有月之暗面，最近几个月，俨然成为了各个大模型公司的“融资时刻”： 7月25日，百川智能完成了50

发表于 08-15 09:12 •361次阅读

新火种AI 月之暗面再获融资！200<b class='flag-5'>亿</b>估值，中国<b class='flag-5'>模型</b>公司新宠儿？

深圳恒兴隆｜制造业的新星：高光超精电主轴的崛起...

的高精度和高稳定性要求。三、高光超精电主轴的未来发展趋势随着制造业的不断发展和技术的不断进步，高光超

发表于 05-13 09:55

超星未来完成数亿元Pre-B轮融资，加码边缘侧大模型推理芯片

近日，边缘侧人工智能芯片提供商北京超星未来科技有限公司完成数亿元Pre-B轮融资，投资方包括中安资本、梁溪科创、龙鼎投资、天智投资、陕汽智能汽车基金和讯飞创投。

发表于 05-10 14:35 •1150次阅读

高通支持Meta Llama 3在骁龙终端上运行

高通与Meta携手合作，共同推动Meta的Llama 3大语言模型（LLM）在骁龙驱动的各类终端设备上实现高效运行。此次合作致力于优化Lla

发表于 05-09 10:37 •428次阅读

通义千问推出1100亿参数开源模型

通义千问近日震撼发布1100亿参数的开源模型Qwen1.5-110B，这一举措标志着通义千问在AI领域迈出了重大步伐。该模型成为通义千问全系

发表于 05-06 10:49 •576次阅读

高通支持Meta Llama 3大语言模型在骁龙旗舰平台上实现终端侧执行

高通和Meta合作优化Meta Llama 3大语言模型，支持在未来的骁龙旗舰平台上实现终端侧执

发表于 04-20 09:13 •501次阅读

真实用户体验，终端大模型能为信息无障碍做些什么

终端大模型

脑极体
发布于 :2024年03月20日 17:04:44

荣耀引领端侧AI新时代

在今年的MWC盛会上，荣耀宣布与高通、Meta携手，将70亿参数大模型引入端侧，这一创新举措预示

发表于 03-01 10:28 •630次阅读

蚂蚁推出20亿参数多模态遥感模型SkySense

据了解，负责开发的百灵团队利用自身拥有的19亿遥感影像数据集进行了预训练，从而生成了具有20.6亿参数的SkySense大模型。官方称其为全球范围内

发表于 02-28 15:53 •662次阅读

高通在2024 MWC展示终端侧AI、智能计算和无线连接新突破

在今年的MWC巴塞罗那展会上，高通技术公司大放异彩，宣布了一系列在终端侧AI、智能计算和无线连接领域的最新产品及重要里程碑。这些创新旨在加速

发表于 02-27 11:04 •790次阅读

高通持续推动终端侧生成式AI变革，推出高通AI Hub赋能开发者

高通现赋能终端侧AI在下一代PC、智能手机、软件定义汽车、XR设备和物联网等领域规模化商用，让智能计算无处不在。

发表于 02-26 16:46 •609次阅读

搜索历史

高通：未来几个月有望在终端侧运行超100亿参数的模型

评论

讯飞星火端侧模型发布

李彦宏宣布：百度文心大模型日调用量超15亿

航天级100krad 100V高侧电流检测电路

英伟达震撼发布:全新AI模型参数规模跃升至80亿量级

新火种AI 月之暗面再获融资！200亿估值，中国模型公司新宠儿？

深圳恒兴隆｜制造业的新星：高光超精电主轴的崛起...

超星未来完成数亿元Pre-B轮融资，加码边缘侧大模型推理芯片

高通支持Meta Llama 3在骁龙终端上运行

通义千问推出1100亿参数开源模型

高通支持Meta Llama 3大语言模型在骁龙旗舰平台上实现终端侧执行

真实用户体验，终端大模型能为信息无障碍做些什么

荣耀引领端侧AI新时代

蚂蚁推出20亿参数多模态遥感模型SkySense

高通在2024 MWC展示终端侧AI、智能计算和无线连接新突破

高通持续推动终端侧生成式AI变革，推出高通AI Hub赋能开发者