0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

后摩智能推出边端大模型AI芯片M30,展现出存算一体架构优势

Carol Li 来源:电子发烧友 作者:李弯弯 2024-07-03 00:58 次阅读

电子发烧友网报道(文/李弯弯)近日,后摩智能推出基于存算一体架构的边端大模型AI芯片——后摩漫界™️M30,最高算力100TOPS,典型功耗12W。为了进一步提升部署的便捷性,后摩智能还同步推出了基于M30芯片的智算模组(SoM)和力谋®️AI加速卡。

后摩智能存算一体架构芯片产品

后摩智能是一家专注于存算一体芯片技术的创新型企业,成立于2020年。该公司基于先进的存算一体技术和存储工艺,致力于突破芯片的性能与功耗瓶颈。存算一体架构将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传统方式的计算效率。

2023年5月10日,后摩智能发布了其第一款芯片产品——后摩鸿途®️H30智驾芯片,该芯片最高物理算力达到256TOPS,这一数值略高于英伟达Orin-X的254TOPS,展现出强大的计算能力。在Int8数据精度下,其AI核心IPU能效比高达15Tops/W,是传统架构芯片的7倍以上,实现了高效的AI计算。

后摩鸿途®️H30智驾芯片典型功耗仅为35W,这使得鸿途®️H30在提供高算力的同时,也保持了较低的能耗水平。SoC能效比达到7.3Tops/W,体现了存算一体架构在提升能效比方面的优势。鸿途®️H30获得了ASIL D级功能安全流程认证,这是车规安全等级中的最高标准,确保了芯片在智能驾驶应用中的可靠性和稳定性。

鸿途®️H30采用存算一体架构,将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传统方式的计算效率。基于SRAM的纯数字设计,实现存内运算,在存储器内能完全实现数据处理,打破了传统芯片性能瓶颈并提升了能效比。

此外,该芯片基于自研IPU(Intelligence Processing Unit)架构——天枢架构,通过多核、多硬件线程以及双环拓扑总线的设计,保证了计算资源利用效率的同时可以灵活扩展算力。支持外扩Memory,最高带宽为128GB/s,以及16路FHD Encoder/Decoder和PCIe 4.0等多种接口,满足了不同应用场景的需求。

鸿途®️H30智驾芯片专为智能驾驶设计,支持运行点云网络、BEV网络等智能驾驶主流算法,能够支持L4级自动驾驶。该芯片已经成功在无人配送车上完成路测,展现了避让前方行人、识别红绿灯等智能驾驶能力。基于鸿途®️H30,后摩智能还推出了力驭®智能驾驶计算平台,为智能驾驶提供了更充沛的算力支持。

近期,后摩智能推出其第二款产品——后摩漫界™M30边端大模型AI芯片,该芯片在边端设备的大模型部署中展现出了卓越的性能和能效比。

后摩漫界™️M30最高算力达到100TOPS,这一强大的算力使得M30能够轻松应对边端侧大模型部署对高算力的需求。其典型功耗仅为12W,实现了高性能与低功耗的完美融合,为边端设备提供了更长的续航时间和更低的能耗成本。

据介绍,M30是一款通用的边端大模型AI芯片,能够支持多种大模型,包括但不限于ChatGLM、Llama2、通义千问等。这一特性使得M30在处理复杂AI任务时具有更高的灵活性和适应性。在运行Qwen1.5-7B-Chat等大模型时,M30的运行性能可达15-20 Tokens/s,这一表现足以证明其在处理复杂AI任务时的卓越能力。

为了进一步提升部署的便捷性,后摩智能还同步推出了基于M30芯片智算模组(SoM)和力谋®️AI加速卡。智算模组(SoM),支持PCIe EP模式,以其小巧的体积、强劲的性能和极低的功耗,成为小型化设备和功耗敏感嵌入式场景的理想选择。

力谋®️AI加速卡,作为标准的半高半长PCIe加速卡,能在PC、一体机和服务器中实现快速部署。支持主动散热和被动散热两种模式,确保设备在不同环境下的稳定运行。

后摩漫界™M30芯片具有高性能、低功耗和通用性特点,可广泛应用于多个领域,包括AI PC、边缘AI一体机、智能座舱、商用显示、智能融合网关、NAS(网络附加存储)等。

存算一体架构在边端大模型AI芯片中的优势

随着AI大模型部署需求从云端迅速向端侧和边缘侧设备迁移,AI芯片的性能、功耗和响应速度面临前所未有的挑战。基于存算一体架构的后摩漫界™️M30芯片在这方面表现出显著的优势,它兼具高性能与低功耗特性,可满足边端侧大模型部署对高效率和实时性的严苛要求。

具体来看,在性能提升方面,存算一体架构通过将存储单元与计算单元集成在同一片芯片上,实现了计算与存储的紧密耦合,从而提高了数据处理的速度和效率。同时,由于数据在芯片内部直接进行计算,避免了传统架构中数据在存储器和处理器之间频繁传输所产生的延迟。这对于需要实时响应的边端应用场景尤为重要。

在功耗降低方面,存算一体架构减少了数据传输的能量损耗,使得芯片在保持高性能的同时,能够显著降低功耗。而且,采用非易失性存储介质(如ReRAM)的存算一体芯片,在不需要进行数据读写时,可以保持极低的静态功耗,甚至为零功耗。

在数据处理效率方面,存算一体架构避免了传统架构中数据在存储器和处理器之间的大量搬运,减少了数据传输的带宽需求,提高了数据处理的效率。存算一体架构能够支持更多的并行计算任务,提高了芯片的整体处理能力和吞吐量。

在成本控制方面,存算一体架构可以在不依赖先进制程的前提下,通过优化芯片设计和算法,实现较高的算力和能效比。这有助于降低芯片的生产成本,提高市场竞争力。同时,由于芯片内部集成了存储单元,减少了对外部存储器的依赖,从而降低了系统的整体成本。

从应用场景方面来看,存算一体架构特别适用于对算力、功耗和实时性有较高要求的边端设备,如智能手机、可穿戴设备、智能家居设备等。在大数据处理和AI推理等应用场景中,存算一体架构能够提供高效的数据处理能力和低延迟的响应速度,满足复杂计算任务的需求。

写在最后

存算一体架构的边端大模型AI芯片,如后摩漫界™️M30,通过创新的设计实现了高性能、低功耗和实时性的完美结合。随着AI大模型应用的不断扩展和边端设备需求的增加,这种架构的芯片将在未来发挥更加重要的作用,推动AI技术在更多领域的深入应用和发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI芯片
    +关注

    关注

    17

    文章

    1855

    浏览量

    34887
  • 后摩智能
    +关注

    关注

    0

    文章

    22

    浏览量

    1176
  • 大模型
    +关注

    关注

    2

    文章

    2302

    浏览量

    2414
收藏 人收藏

    评论

    相关推荐

    一体架构创新助力国产大AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《一体
    的头像 发表于 10-23 14:48 219次阅读

    科技新突破:首款支持多模态一体AI芯片成功问世

    一体介质,通过存储单元和计算单元的深度融合,采用22nm成熟工艺制程,有效把控制造成本。与传统架构下的AI
    发表于 09-26 13:51 334次阅读
    科技新突破:首款支持多模态<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>成功问世

    智能首款一体智驾芯片获评突出创新产品奖

    近日,2024年6月29日,由深圳市汽车电子行业协会主办的「第十三届国际汽车电子产业峰会暨2023年度汽车电子科学技术奖颁奖典礼」在深圳宝安隆重举行。智能首款
    的头像 发表于 09-24 16:51 439次阅读

    智能与联想携手共创AI PC新纪元

    近日,国内领先的一体AI芯片创新企业
    的头像 发表于 08-02 16:11 462次阅读

    智能与联想集团签署战略协议 共同探索AI PC技术创新与应用

    能力,共同致力于推动 AI力向边缘侧和侧的下沉,为终端用户带来更高效、更智能的产品与服务。
    的头像 发表于 07-31 17:24 820次阅读

    一体AI芯片企业智能完成数亿元战略融资

    近日,国内领先的一体AI 芯片创新企业
    的头像 发表于 07-15 15:32 372次阅读

    智能引领AI芯片革命,推出模型AI芯片M30

    的技术实力,推出了基于一体架构
    的头像 发表于 06-28 15:13 624次阅读

    科技助力AI应用落地:WTMDK2101-ZT1评估板实地评测与性能揭秘

    一体芯片的发展历程、当前研究状态,以及基于多种存储介质(例如传统的DRAM、SRAM和Flash,以及新型的非易失性存储器如ReRAM、PCM、MRAM、FeFET等)的内计算基本
    发表于 05-16 16:38

    探索内计算—基于 SRAM 的内计算与基于 MRAM 的一体的探究

    本文深入探讨了基于SRAM和MRAM的一体技术在计算领域的应用和发展。首先,介绍了基于SRAM的内逻辑计算技术,包括其原理、优势以及在
    的头像 发表于 05-16 16:10 2442次阅读
    探索<b class='flag-5'>存</b>内计算—基于 SRAM 的<b class='flag-5'>存</b>内计算与基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>的探究

    科技携手北大共建一体化技术实验室,推动AI创新

    揭牌仪式结束,王绍迪在北大集成电路学院举办的“未名·芯”论坛上做了主题演讲,分享了他对于多模态大模型时代内计算发展的见解。他强调了
    的头像 发表于 05-08 17:25 870次阅读

    智能助力中国移动构建力网络

    智能助力中国移动构建力网络,MWC展示模型
    的头像 发表于 03-14 14:48 592次阅读
    <b class='flag-5'>后</b><b class='flag-5'>摩</b><b class='flag-5'>智能</b>助力中国移动构建<b class='flag-5'>算</b>力网络

    一体芯片如何支持Transformer等不同模型

    智能致力于打造通用人工智能芯片,自主研发的
    的头像 发表于 01-05 14:14 1285次阅读

    SRAM一体芯片的研究现状和发展趋势

    人工智能时代对计算芯片力和能效都提出了极高要求。一体
    的头像 发表于 01-02 11:02 2282次阅读
    SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>芯片</b>的研究现状和发展趋势

    智能与优控智行共同打造智能汽车硬件平台及综合解决方案

    12月28日,智能与优控智行正式签署战略合作,双方将基于智能
    的头像 发表于 12-29 14:36 901次阅读

    浅谈为AI力而生的-芯片

    模型爆火之后,一体获得了更多的关注与机会,其原因之是因为
    发表于 12-06 15:00 365次阅读
    浅谈为<b class='flag-5'>AI</b>大<b class='flag-5'>算</b>力而生的<b class='flag-5'>存</b><b class='flag-5'>算</b>-<b class='flag-5'>体</b><b class='flag-5'>芯片</b>