0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大算力时代 芯动力走出可重构架构创新“芯”路径

科技数码 来源:科技数码 作者:科技数码 2023-07-21 09:47 次阅读

“未来可能不是百模大战,而是万模群舞。”自ChatGPT掀起大模型的发展热潮之后,层出不穷的大模型已然蜂拥而入,风雷激荡。但在经历了最初的惊艳之后,行业已转移到对商业化落地的冷静观察,一方面业界认可垂直类应用模型有望率先实现落地应用,另一方面AI大模型的压缩和优化发展,使得向边缘端渗透的步伐也在加快,边缘算力的重要性正加速凸显。

以更直观的数据来看,有预测到2030年,边缘计算潜在市场将在10年内以48%的复合年增长率从2020年的90亿美元增长到2030年的4450亿美元。而且,中国是边缘算力的主战场,预估到2026年全球26%的网络边缘站点将位于中国。

通用GPU这一算力主流芯片在经过AI的淬炼之后,如何更进一步,承接AI大模型下沉至边缘端的新机遇?无疑,这将更是一场实打实的硬仗。

可重构架构打造算力第三极

在日前举办的第六届世界人工智能大会(WAIC)上,珠海芯动力、天数智芯、燧原科技、登临科技、爱芯元智、沐曦等企业展出的芯片、加速卡、软硬件解决方案和广泛的行业应用,成为WAIC不容错过的“风景”。

wKgaomS5476ABlRLAAErioNxqbk349.jpg

在WAIC舞台同场竞技的背后,暗藏的逻辑是通用GPU厂商比拼的赛点,已经从单纯的性能指标转向进入真实应用场景落地的较量,边缘侧的竞夺也走向白热化。

“随着AIGC兴起,算力将成为重要的生产力。相比云端,边缘侧应用场景更广泛,也更能促进生产力的提升创造价值,将对通用GPU产生巨大的市场机会。”芯动力CEO李原乐观表示。

显然这涉及通用GPU的算力、扩展性和编程性、生态等多维度的比拼。在这一市场,英伟达AMD英特尔等占据强势地位,且在当下国内半导体制造面临全面打压的情形下,我国通用GPU企业想要撕开一道口子,有专家建议不能按“常理”出牌,需要从架构、材料、封装等层面进行创新。

不走寻常路,发布首款基于可重构架构的GPGPU芯片RPP-R8的珠海芯动力可谓独辟蹊径。该公司在2017年成功研发出可重构并行处理器(RPP)架构,借助于独有的底层硬件架构,自带高性能、原生支持CUDA语言和低功耗等“光芒”,可对AI推理的性能进行深度优化。

wKgZomS547-AC0BzAABlxF5HBlw152.jpg

(RPP-六边形战士)

芯动力创始人李原分析,在可重构芯片面世之前,AI算力芯片主要有专用和通用GPU两大类,专用芯片性能虽强但编程能力差,有的通用GPU可编程性高但算力不强,要从激烈的竞争中脱颖而出,必须建立强大的优势,而第三类可重构芯片则将两类产品的优势“合二为一”,将跻身成为通用GPU的新一极。

wKgaomS547-AVqSDAAB9Q-sfw2k037.jpg

据悉,RPP-R8作为一款通用GPU,每颗芯片内含有1024个计算核,相比传统GPU架构在同样的算力占用更小的芯片面积,实现了低功耗和高能效的有效平衡。此外,面积效率比可达到同类产品的7~10倍,能效比也超过3倍。而且,除原生支持CUDA之外,芯动力还拥有自主开发的工具链,使得其能够在cuDNN和TensorRT上实现API的兼容,同时也支持广泛的人工智能框架,如TensorFlow和Pytorch等,可全面满足高效并行计算及AI算力应用。

凭借高能效、高算力、低功耗、编程灵活等功力的“加持”,芯动力的RPP-R8在边缘侧的落地也在快马加鞭。

解决客户痛点 打开落地之旅

触及落地,尽管RPP-R8的性能和生态独树一帜,但作为一个新生“物种”,仍要面临逐级解锁的过程。

对此李原认为,边缘侧的市场巨大,传统市场的AI加速是刚需,通用GPU可替代专用芯片打入供应链;而新兴市场的需求如智能安防、机器视觉等市场也在持续扩容。但落地最重要的是要解决客户的痛点,要厘清市场的规律。

李原进一步剖析,芯片公司容易陷入提倡软硬件一体化的“怪圈”,但边缘侧终端客户对成本并非那么敏感,从产业链来看,芯片公司的客户大都为设备厂商,处于终端客户的下游,一方面芯片公司要学会将更多利润留给设备厂商,让他们有动力合作切入市场,另一方面芯片公司的客户大都有实力进行软件自主开发,因而要顺应软硬件分离的需求。

wKgZomS547-AOAtiAAA2qCDAyt8534.jpg

“因而,芯动力提供的是一个过硬的纯硬件,加上底层兼容x86、Arm、Windows等软件系统,与其他家的软件结合在一起可快速应用,让客户可顺畅地进行开发,有效帮助企业降低开发成本和产品周期,加速产品迭代与扩展,这是共赢之道和长久之道。”李原分析说。

基于这样的深刻洞察,加上直击痛点以及秉承让利的“哲学”,让芯动力的产品在落地之旅行进在“坦途”之上。李原提到,芯动力产品在智能安防、工业自动化等一些行业因可切实解决设备厂商的痛点,具有不可替代性,起量非常快,基本已处于拐点,更大规模的出货将顺利推进。

而这只是芯动力的“一小步”,未来还有更辽阔的征程。

李原介绍,芯动力已推出了基于可重构架构RPP-R8系列三种不同封装形式的GPGPU芯片,分别是AE8100、AE7100和AE6100;每一款芯片能够满足相对的应用场景需求。

wKgaomS547-ATkkwAABoPIm5nww787.jpg

“AE8100芯片面向边缘服务器等领域,对体积、功耗要求较高;AE7100芯片着力面向低功耗、小体积的应用场景;AE6100则聚焦于更小体积上承载更大的性能,正在与客户一起定义,针对机器视觉的Camera,融合信号采集、图像处理和GPU加速等功能,以代替前端的ISP,下半年将着重在工业视觉领域实现新的突破。”李原踌躇满志表示。

不再跟随?创新当道

在AIGC热潮掀起通用GPU的算力革命之际,一个更值得业界深思的问题也浮出水面。

“业界均认为AIGC大模型是一大风口,一大史诗级机遇。但值得深思的是,中国这么多AI公司和GPU公司,为什么美国开大模型之先河?如果不深刻反省,下次再有风口出现时我们还是被动跟随的境况。”李原的表述中藏着一些深层的内省。

李原进一步提议,对国内高科技界来说,最重要的是要思考未来十年会向什么方向演变?如果只是一味地跟随或Repeating,实际上没有太大价值,也走不出这一循环。

着眼于通用GPU发展,李原高瞻远瞩地表示,下一个十年比拼的是它的效率,而不仅是性能。为持续降低时延和提高带宽,将衍生出众多新技术,业界应着力解决芯片外部互联挑战,并尝试采用光电子技术,突破原有的方式才有可能实现超越。

此外,chiplet成为未来算力芯片“扩张”的必然之路,也将产生更多Cost Effective的效果。李原提到,芯动力也将在这一方向持续耕耘,加强与FPGA厂商合作共赢,切入更多场景,为客户带来更具想象力的价值。

对于CUDA兼容的走向,李原也洞察道,客户不在意底层是用CUDA或别的语言,最重要的是能够快速迭代、快速开发。在已经选用了CUDA语言的领域里,我们会尊重客户的选择,但在新的领域里,完全可以有自由的选择。

伴随生成式AI带动下的这场新兴科技革命,边缘计算的价值将被如芯动力这批“抢滩登陆”的企业率先释放,而芯动力的未来之路,也将成为国内众多行业的数字化、智能化转型升级的动力之源。

(来源/爱集微)

审核编辑 黄宇


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    454

    文章

    50475

    浏览量

    422053
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4704

    浏览量

    128742
  • AI
    AI
    +关注

    关注

    87

    文章

    30276

    浏览量

    268509
  • 大模型
    +关注

    关注

    2

    文章

    2347

    浏览量

    2509
收藏 人收藏

    评论

    相关推荐

    亿铸科技入选毕马威中国“科技”新锐企业50强

    日前,毕马威中国“科技”新锐企业50榜单正式揭晓,亿铸科技凭借在基于存一体的AI大芯片领域的创新实力和卓越表现,荣登“
    的头像 发表于 11-18 10:15 174次阅读

    启源成为产业发展方阵会员单位

    近日,由中国信息通信研究院(以下简称“信通院”)牵头成立的产业发展方阵在合肥市成功召开第一次工作组全会,启源电子科技有限公司受邀参与此次大会并正式成为
    的头像 发表于 11-04 09:34 207次阅读

    一体架构创新助力国产大AI芯片腾飞

    在湾展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《存一体架构创新助力国产大
    的头像 发表于 10-23 14:48 241次阅读

    芯片 高性能 CPU/GPU/NPU 微架构分析》第1-4章阅读心得——之巅:从基准测试到CPU微架构的深度探索

    。这一方法突显了现代超的核心优势——并行计算能力。举一个具体实例来说,天河二号采用了异构架构,集成了英特尔至强处理器和中国自主研发的申威众核加速器。这种CPU与协处理器的结合不仅提升了整体计算性能
    发表于 10-19 01:21

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    、GPU、NPU,给我们剖析了芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解芯片。 全书共11章,
    发表于 10-15 22:08

    【「大模型时代的基础架构」阅读体验】+ 未知领域的感受

    国庆前就收到《大模型时代的基础架构》一书,感谢电子发烧友论坛。欢度国庆之余,今天才静下心来体验此书,书不厚,200余页,彩色图例,印刷精美! 当初申请此书,主要是看到副标题“大模型
    发表于 10-08 10:40

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    试用评测资格! 前言 不知不觉中,我们来到一个计算机科学飞速发展的时代,手机和计算机中各类便捷的软件已经融入日常生活,在此背景下,硬件特别是强劲的芯片,对于软件服务起到不可替代的支撑作用。芯片的
    发表于 09-02 10:09

    大模型时代需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    名单公布!【书籍评测活动NO.41】大模型时代的基础架构:大模型中心建设指南

    工作日内未联系,视为放弃本次试用评测资格! 书籍介绍 大模型是近年来引人注目的热点之一。大模型蓬勃发展的基础,是针对其需求设计的及基础架构。本书针对如何为大模型构建基础架构进行深入
    发表于 08-16 18:33

    人工智能荣获“2024AI创新企业奖”

    近日,稀疏计算引领者墨人工智能宣布,公司荣获由中国科技产业智库「甲子光年」主办的“甲子引力X:星辰100榜单”评选的“2024AI创新企业奖”。
    的头像 发表于 05-17 09:06 422次阅读
    墨<b class='flag-5'>芯</b>人工智能荣获“2024AI<b class='flag-5'>算</b><b class='flag-5'>力</b>层<b class='flag-5'>创新</b>企业奖”

    力系列基础篇——101:从零开始了解

    相信大家已经感受到,我们正处在一个人工智能时代。如果要问在人工智能时代最重要的是什么?那必须是:
    的头像 发表于 04-24 08:05 1002次阅读
    <b class='flag-5'>算</b>力系列基础篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:从零开始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    时代, 如何打破内存墙

    设计的不断革新,进入了大时代。 目前,主流AI芯片的架构仍然沿用了传统的冯·诺依曼模型,这一设计将计算单元与数据存储分离。在这种架构下,
    的头像 发表于 03-06 19:51 296次阅读
    大<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>时代</b>, 如何打破内存墙

    是德科技智能’技术研讨会回顾

    2023年12月20日,是德科技成功举办了智能’技术研讨会。此次研讨会由是德科技的行业市场经理周巍策划并主持,研讨会聚焦网络,
    的头像 发表于 01-17 09:34 690次阅读

    锐成微亮相智能网联汽车“动力成果发布暨技术交流对接会

    12月21日,由工信部产业发展促进中心等主办的智能网联汽车“动力成果发布暨技术交流对接会在福州圆满举办,作为本次大会的重头戏,《“动力汽车芯片产品评审规程》《汽车AI芯片
    的头像 发表于 12-27 18:16 803次阅读

    燧原科技与青云科技达成战略合作,创新异构调度

    NEWS 燧原科技与青云科技日前达成战略合作,携手创新异构资源池的灵活调度,共建支持场景落地的AI生态,为AI应用快速落地、AI
    的头像 发表于 12-11 12:20 625次阅读