0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

后摩智能推出边端大模型AI芯片M30,展现出存算一体架构优势

Carol Li 来源:电子发烧友 作者:李弯弯 2024-07-03 00:58 次阅读

电子发烧友网报道(文/李弯弯)近日,后摩智能推出基于存算一体架构的边端大模型AI芯片——后摩漫界™️M30,最高算力100TOPS,典型功耗12W。为了进一步提升部署的便捷性,后摩智能还同步推出了基于M30芯片的智算模组(SoM)和力谋®️AI加速卡。

后摩智能存算一体架构芯片产品

后摩智能是一家专注于存算一体芯片技术的创新型企业,成立于2020年。该公司基于先进的存算一体技术和存储工艺,致力于突破芯片的性能与功耗瓶颈。存算一体架构将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传统方式的计算效率。

2023年5月10日,后摩智能发布了其第一款芯片产品——后摩鸿途®️H30智驾芯片,该芯片最高物理算力达到256TOPS,这一数值略高于英伟达Orin-X的254TOPS,展现出强大的计算能力。在Int8数据精度下,其AI核心IPU能效比高达15Tops/W,是传统架构芯片的7倍以上,实现了高效的AI计算。

后摩鸿途®️H30智驾芯片典型功耗仅为35W,这使得鸿途®️H30在提供高算力的同时,也保持了较低的能耗水平。SoC能效比达到7.3Tops/W,体现了存算一体架构在提升能效比方面的优势。鸿途®️H30获得了ASIL D级功能安全流程认证,这是车规安全等级中的最高标准,确保了芯片在智能驾驶应用中的可靠性和稳定性。

鸿途®️H30采用存算一体架构,将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传统方式的计算效率。基于SRAM的纯数字设计,实现存内运算,在存储器内能完全实现数据处理,打破了传统芯片性能瓶颈并提升了能效比。

此外,该芯片基于自研IPU(Intelligence Processing Unit)架构——天枢架构,通过多核、多硬件线程以及双环拓扑总线的设计,保证了计算资源利用效率的同时可以灵活扩展算力。支持外扩Memory,最高带宽为128GB/s,以及16路FHD Encoder/Decoder和PCIe 4.0等多种接口,满足了不同应用场景的需求。

鸿途®️H30智驾芯片专为智能驾驶设计,支持运行点云网络、BEV网络等智能驾驶主流算法,能够支持L4级自动驾驶。该芯片已经成功在无人配送车上完成路测,展现了避让前方行人、识别红绿灯等智能驾驶能力。基于鸿途®️H30,后摩智能还推出了力驭®智能驾驶计算平台,为智能驾驶提供了更充沛的算力支持。

近期,后摩智能推出其第二款产品——后摩漫界™M30边端大模型AI芯片,该芯片在边端设备的大模型部署中展现出了卓越的性能和能效比。

后摩漫界™️M30最高算力达到100TOPS,这一强大的算力使得M30能够轻松应对边端侧大模型部署对高算力的需求。其典型功耗仅为12W,实现了高性能与低功耗的完美融合,为边端设备提供了更长的续航时间和更低的能耗成本。

据介绍,M30是一款通用的边端大模型AI芯片,能够支持多种大模型,包括但不限于ChatGLM、Llama2、通义千问等。这一特性使得M30在处理复杂AI任务时具有更高的灵活性和适应性。在运行Qwen1.5-7B-Chat等大模型时,M30的运行性能可达15-20 Tokens/s,这一表现足以证明其在处理复杂AI任务时的卓越能力。

为了进一步提升部署的便捷性,后摩智能还同步推出了基于M30芯片智算模组(SoM)和力谋®️AI加速卡。智算模组(SoM),支持PCIe EP模式,以其小巧的体积、强劲的性能和极低的功耗,成为小型化设备和功耗敏感嵌入式场景的理想选择。

力谋®️AI加速卡,作为标准的半高半长PCIe加速卡,能在PC、一体机和服务器中实现快速部署。支持主动散热和被动散热两种模式,确保设备在不同环境下的稳定运行。

后摩漫界™M30芯片具有高性能、低功耗和通用性特点,可广泛应用于多个领域,包括AI PC、边缘AI一体机、智能座舱、商用显示、智能融合网关、NAS(网络附加存储)等。

存算一体架构在边端大模型AI芯片中的优势

随着AI大模型部署需求从云端迅速向端侧和边缘侧设备迁移,AI芯片的性能、功耗和响应速度面临前所未有的挑战。基于存算一体架构的后摩漫界™️M30芯片在这方面表现出显著的优势,它兼具高性能与低功耗特性,可满足边端侧大模型部署对高效率和实时性的严苛要求。

具体来看,在性能提升方面,存算一体架构通过将存储单元与计算单元集成在同一片芯片上,实现了计算与存储的紧密耦合,从而提高了数据处理的速度和效率。同时,由于数据在芯片内部直接进行计算,避免了传统架构中数据在存储器和处理器之间频繁传输所产生的延迟。这对于需要实时响应的边端应用场景尤为重要。

在功耗降低方面,存算一体架构减少了数据传输的能量损耗,使得芯片在保持高性能的同时,能够显著降低功耗。而且,采用非易失性存储介质(如ReRAM)的存算一体芯片,在不需要进行数据读写时,可以保持极低的静态功耗,甚至为零功耗。

在数据处理效率方面,存算一体架构避免了传统架构中数据在存储器和处理器之间的大量搬运,减少了数据传输的带宽需求,提高了数据处理的效率。存算一体架构能够支持更多的并行计算任务,提高了芯片的整体处理能力和吞吐量。

在成本控制方面,存算一体架构可以在不依赖先进制程的前提下,通过优化芯片设计和算法,实现较高的算力和能效比。这有助于降低芯片的生产成本,提高市场竞争力。同时,由于芯片内部集成了存储单元,减少了对外部存储器的依赖,从而降低了系统的整体成本。

从应用场景方面来看,存算一体架构特别适用于对算力、功耗和实时性有较高要求的边端设备,如智能手机、可穿戴设备、智能家居设备等。在大数据处理和AI推理等应用场景中,存算一体架构能够提供高效的数据处理能力和低延迟的响应速度,满足复杂计算任务的需求。

写在最后

存算一体架构的边端大模型AI芯片,如后摩漫界™️M30,通过创新的设计实现了高性能、低功耗和实时性的完美结合。随着AI大模型应用的不断扩展和边端设备需求的增加,这种架构的芯片将在未来发挥更加重要的作用,推动AI技术在更多领域的深入应用和发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI芯片
    +关注

    关注

    17

    文章

    1756

    浏览量

    34533
  • 后摩智能
    +关注

    关注

    0

    文章

    17

    浏览量

    1126
  • 大模型
    +关注

    关注

    2

    文章

    1895

    浏览量

    1515
收藏 人收藏

    评论

    相关推荐

    后摩智能引领AI芯片革命,推出边端大模型AI芯片M30

    的技术实力,推出了基于存算一体架构的边端大模型AI芯片——后摩漫界™️
    的头像 发表于 06-28 15:13 287次阅读

    英伟达加速AI芯片迭代,推出Rubin架构计划

    在近日举办的COMPUTEX 2024展会上,英伟达CEO黄仁勋再次展现了公司在人工智能AI芯片领域的雄心壮志。他公布了下一代AI
    的头像 发表于 06-03 11:36 512次阅读

    HiDream.ai(智象未来)在生成式人工智能领域展现出了巨大潜力

    该领域的杰出代表,凭借其丰富的学术研究和商业实践经验,为生成式人工智能的发展做出了重要贡献,其在 2023 年 3 月创立的 HiDream.ai(智象未来)在生成式人工智能领域展现出
    的头像 发表于 05-21 10:26 325次阅读

    科技助力AI应用落地:WTMDK2101-ZT1评估板实地评测与性能揭秘

    一体芯片的发展历程、当前研究状态,以及基于多种存储介质(例如传统的DRAM、SRAM和Flash,以及新型的非易失性存储器如ReRAM、PCM、MRAM、FeFET等)的内计算基本
    发表于 05-16 16:38

    内计算WTM2101编译工具链 资料

    内计算是突破物理极限的下力技术- AIGC等人工智能新兴产业的快速发展离不开力,力的
    发表于 05-16 16:33

    步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    2024年3月19日,[英伟达]CEO[黄仁勋]在GTC大会上公布了新AI芯片架构BLACKWELL,并推出基于该
    发表于 05-13 17:16

    Snowflake推出面向企业AI的大语言模型

    Snowflake公司近日推出了企业级AI模型——Snowflake Arctic,这是一款大型语言模型(LLM),专为满足企业复杂工作负载的需求而设计。Snowflake Arcti
    的头像 发表于 05-07 10:03 254次阅读

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    关系,从而在各种任务中表现出色。Transformer架构推出,标志着语言模型技术的重大突破。它摒弃了传统的递归方式,利用自注意力机制捕捉序列中的依赖关系。这
    发表于 05-04 23:55

    猎户星空发布强大AI模型

    近日,猎户星空在2024·傅盛的开年AI大课暨猎户星空企业应用大模型发布会上,正式发布了其最新研发的大模型。这个大模型拥有140亿参数,却能实现千亿参数大
    的头像 发表于 01-22 14:31 452次阅读

    走向边缘智能,美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型

    近日,美格智能发挥软硬件一体协同开发能力,融合阿加犀卓越的AI优化部署技术,在搭载高通QCS8550平台的高算力AI模组上,成功运行了一系列大语言
    的头像 发表于 11-14 14:39 630次阅读

    走向边缘智能,美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型

    模型、RedPajama、ChatGLM2、Vicuna,展现出卓越的边缘端大模型部署能力。▌构建智算底座,加速大模型端侧部署大模型和生成
    的头像 发表于 11-14 14:34 272次阅读
    走向边缘<b class='flag-5'>智能</b>,美格<b class='flag-5'>智能</b>携手阿加犀成功在高算力<b class='flag-5'>AI</b>模组上运行一系列大语言<b class='flag-5'>模型</b>

    #清华 #芯片 #一体化 清华研制出全球首颗一体芯片

    芯片
    深圳市浮思特科技有限公司
    发布于 :2023年10月10日 18:03:59

    RISC-V强势崛起为芯片架构第三极

    不断涌现,所有芯片都值得用RISC-V做次”。 在经历多年的快速成长,RISC-V架构向高性能AI、AP类等
    发表于 08-30 13:53

    智能语音开放平台选哪家,启英泰伦提供硬件、软件一体化开发服务

    可下载到主控芯片中的语音固件,配合语音芯片等硬件工作,实现产品的语音功能。 启英泰伦成立于2015年,在硬件方面,截止目前已推出15款型号的智能语音
    发表于 08-17 14:00

    AI模型在医疗领域起飞

    电子发烧友网报道(文/李弯弯)ChatGPT等大型语言模型在语言理解、生成、知识推理等方面正展现出令人惊艳的能力。近段时间,各企业开始探索大模型在不同行业中的应用落地,并针对不同领域推出
    的头像 发表于 07-25 00:12 1646次阅读