0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大算力芯片面临的技术挑战和解决策略

亿铸科技 来源:亿铸科技 2024-10-23 14:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在湾芯展SEMiBAY2024《HBM与存储器技术与应用论坛》上,亿铸科技创始人、董事长兼CEO熊大鹏发表了题为《超越极限:大算力芯片面临的技术挑战和解决策略》的演讲。

熊大鹏博士提出,在AI大模型技术的推动下,算力迎来需求拐点,硬件架构将成为满足算力需求的关键路径之一,未来算力增长将以存储单元为中心

大模型时代的机遇与挑战

在AI大模型时代,随着数据、算力、参数量的不断提升,模型能力显著增强。熊大鹏博士指出,大模型已经从量变逐渐演变为质变,当模型体量足够大时,会出现类似人类“开悟”的涌现能力,大模型的推理能力将显著提升。这一变化预示着AI应用的最后一公里即将打通,业务落地将推动对AI计算能力的需求迎来拐点。

Omdia最新报告《云计算和数据中心人工智能处理器预测》显示,用于云计算和数据中心人工智能的GPU和其他加速芯片的市场规模已从2022年的不到100亿美元增长到2024年的780亿美元,并预计到2029年将达到1510亿美元。然而,2026年市场可能会出现一个明显的拐点,增长动力将从技术采用转向人工智能应用需求的变化。

此外,IDC预测,未来的人工智能服务器将注重提高计算能力和处理效率(能效比),以适应更复杂、更大规模的人工智能应用。预计到2027年,用于推理的AI算力占比将达到72.6%,未来有望达到95%为推理,5%为训练。

应用落地需要硬件架构突破

然而,现有的芯片硬件性能提升速度已难以满足算法模型急剧增长的算力需求。摩尔定律,这个曾经指导半导体行业发展的黄金法则,如今正面临前所未有的挑战。国信证券经济研究所报告指出,大模型参数规模每18个月增长35倍,而摩尔定律下的芯片仅增长2倍。因此,探索和发展新的硬件架构成为算力突破的关键路径之一。

熊大鹏博士强调,在现有的硬件架构下,目前AI芯片面临着“三堵墙”问题:存储墙、能耗墙和编译墙。存储墙是指存储器的数据访问速度跟不上计算单元的数据处理速度,导致性能瓶颈的问题。

同时,由于存储墙的存在则带来了能耗墙和编译墙的问题。能耗墙是指随着芯片性能的提升,能耗和散热问题成为限制进一步性能提升的主要因素。编译墙则是随着AI模型的复杂性增加,编译器需要处理的数据量和计算任务也急剧增加,这使得静态编译优化变得非常困难,手动优化又消耗了大量时间和成本。

存算一体开启算力第二增长曲线

面对这一挑战,亿铸科技选择创新,用“存算一体超异构”架构这一全新的芯片设计思路,极大地减少了数据搬运的延迟,提升了整体的计算效率和能效比。

熊大鹏博士指出,想要打破AI芯片“三堵墙”,就需要从算力的第一性原理(阿姆达尔定律)来着手,将数据搬运量大幅下降,使得F值接近于0,才能保证有效算力密度线性增长。目前业内主要存在两种解决方式:一种是存内计算,另一种是近存计算。

存内计算是通过将存储和计算功能融合,减少数据搬运延迟,提升性能和能效。在理想状态下,F=0,能够实现存储与计算无缝融合。近存计算则是将存储单元和计算单元通过先进封装集成在一起,增加访存带宽、减少数据搬移时延,以提升整体计算效率。

熊大鹏博士强调,通过存算一体架构等技术,可以突破传统计算模式的瓶颈,实现更高的有效算力,打破有效算力的天花板。未来,以算力单元为中心的时代即将结束,算力第二增长曲线将以存储单元为中心。

熊大鹏博士表示,亿铸科技自成立以来,始终致力于通过存算一体,提供贡献更具性价比、更高能效比、更大算力发展空间的AI大算力芯片发展新路径。2023年3月,面对ChatGPT等大模型带来的AI算力挑战,亿铸科技首次提出“存算一体超异构”,为大模型时代AI大算力芯片发展提供全新思路。

未来,随着AI技术的不断进步,算力的需求也在不断增长。亿铸科技将通过创新的存算一体架构,为AI芯片的发展提供新的方向。在大模型时代,亿铸科技的技术和产品将为AI技术的发展提供强大的支持,推动整个行业向前发展。随着亿铸科技技术的不断成熟和应用的不断扩展,我们有理由期待,AI芯片技术将迎来一个新的发展阶段,为科技进步做出更大的贡献!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54463

    浏览量

    469619
  • 算力
    +关注

    关注

    2

    文章

    1697

    浏览量

    16837
  • 亿铸科技
    +关注

    关注

    0

    文章

    32

    浏览量

    1831

原文标题:亿新闻 | 湾芯展演讲回顾:以AI芯片架构创新,迎接算力增长新拐点

文章出处:【微信号:亿铸科技,微信公众号:亿铸科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    爆发时代IP设计面临哪些新挑战

    生成式 AI、Chiplet、多Die 架构、具身智能……新一轮计算浪潮正在深刻改变芯片设计方式,也对底层 IP 技术提出了前所未有的挑战
    的头像 发表于 04-23 13:56 188次阅读

    中科曙光如何应对全球AI供应链变局

    当前,全球AI供应链正经历变局。外部环境的变化,已从单一技术点的限制,演变为对芯片、存储、网络、模型等全栈环节的体系化壁垒。国内智产业
    的头像 发表于 04-13 10:30 474次阅读

    国产出海元年开启

    节点的亮相则宣告:国产的时代,或许真的来了。随着中国芯片与大规模集群技术的突破,国产
    的头像 发表于 03-24 15:15 569次阅读
    国产<b class='flag-5'>算</b><b class='flag-5'>力</b>出海元年开启

    云天励飞正式举办大芯片战略前瞻会

    2月3日,云天励飞正式举办“大芯片战略前瞻会”,首次对外公布未来三年的大 AI 推理芯片
    的头像 发表于 02-06 17:23 3885次阅读

    中国芯片的拐点时刻

    作者|Taylor出品|芯片技术与工艺当OpenAI的GPT-5在得克萨斯州的机房中昼夜轰鸣,当Nvdia的H200芯片被炒至数十万美元仍一卡难求,中国的
    的头像 发表于 01-31 07:00 2068次阅读
    中国<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>的拐点时刻

    光计算芯片面世了,但怎么给它“灌入灵魂”?

    上海交大LightGen全光计算芯片面世,展现颠覆性潜力,但传统测试烧录方式无法适配,其产业化遇后端关键瓶颈。这类计算“新物种”的“烧录”已转为物理调谐,面临接口非标、参数耦合敏感
    的头像 发表于 12-30 17:01 824次阅读

    赋能电源芯片国产替代,智芯谷助力AI稳定前行

    需求激增与技术迭代的双重压力下,电源管理芯片也正面临设计复杂度提升、供应链波动加剧、国产替代进程加速等多重挑战。一、
    的头像 发表于 12-30 12:02 839次阅读
    赋能电源<b class='flag-5'>芯片</b>国产替代,智芯谷助力AI<b class='flag-5'>算</b><b class='flag-5'>力</b>稳定前行

    并购狂欢下的隐秘战场:AI芯片如何通过“烧录大考”?

    挑战。行业通过高速接口、并行架构等技术创新,深化设计与测试协同,采用风险分级与自适应策略平衡质量成本。相关企业正依托技术积淀助力客户提升量产竞争
    的头像 发表于 12-29 17:31 687次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>并购狂欢下的隐秘战场:AI<b class='flag-5'>芯片</b>如何通过“烧录大考”?

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    IP广域网助力互联网建设进入快车道

    人工智能大模型等应用爆发式发展带动了智能需求激增,全国各地纷纷建设大量智中心。在迎来新机遇的同时,力行业也面临数据安全、提高企业用
    的头像 发表于 09-25 10:40 888次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    建立的基础: ①支柱②数据支柱③计算支柱 1) 与AI有关的因素: ①晶体管数量②晶
    发表于 09-18 15:31

    FOPLP工艺面临挑战

    FOPLP 技术目前仍面临诸多挑战,包括:芯片偏移、面板翘曲、RDL工艺能力、配套设备和材料、市场应用等方面。
    的头像 发表于 07-21 10:19 1802次阅读
    FOPLP工艺<b class='flag-5'>面临</b>的<b class='flag-5'>挑战</b>

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    工作者身份的转变期),便对这项技术深深痴迷,但当时主流的RTX20系列,需要2080级别以上的才支持,鉴于个人实力,便将目光放在了9系卡上,这也就是「芯片 | 书中讲的pascal
    发表于 06-18 19:31

    AI 时代来袭,手机芯片面临哪些新挑战

    边缘AI、生成式AI(GenAI)以及下一代通信技术正为本已面临高性能与低功耗压力的手机带来更多计算负载。领先的智能手机厂商正努力应对本地化生成式AI、常规手机功能以及与云之间日益增长的数据传输需求
    的头像 发表于 06-10 08:34 1396次阅读
    AI 时代来袭,手机<b class='flag-5'>芯片面临</b>哪些新<b class='flag-5'>挑战</b>?

    AIGC基础设施技术架构与行业实践

    AIGC基础设施技术架构与行业实践 一、硬件层:AI的物理载体 芯片
    的头像 发表于 05-29 07:44 1138次阅读
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基础设施<b class='flag-5'>技术</b>架构与行业实践