0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

不只是智能驾驶!从SRAM到RRAM,存算一体大算力芯片将赋能更多领域!

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-09-25 07:00 次阅读
电子发烧友网报道(文/李弯弯)近几年,随着物联网人工智能等技术的发展,算力的需求越来越大。而在冯诺依曼架构下,芯片性能的提升遇到瓶颈。业界开始不断探索新的技术形式,因为具备大算力、低功耗的特点,存算一体架构芯片应运而生。

后摩智能是一家致力于存算一体大算力芯片研发的企业,成立于2020年。今年5月,该公司发布了首款SRAM存算一体智驾芯片后摩鸿途™H30,这也是全球首款面向智能驾驶领域的存算一体芯片。此外,今年8月该公司宣布完成首款RRAM存算芯片的测试,可以说在存算一体大算力方面进展迅速。

近日,电子发烧友采访到后摩智能公共事务部负责人屈艳格,就其在存储介质及应用赛道的选择,存算一体发展趋势及后摩智能未来规划方面做了探讨。

从SRAM到RRAM,后摩智能是如何选择存储介质的

后摩智能今年5月推出的首款存算一体智驾芯片H30,最高物理算力256TOPS,典型功耗35W。该芯片基于SRAM存储介质,采用数字存算一体架构,拥有极低访存功耗和超高计算密度,仅用12nm工艺制程,在Int8数据精度下,其AI核心IPU能效比达15Tops/W,是传统架构芯片7倍以上。

据了解,H30已成功运行CV类的经典网络,以及自动驾驶领域先进的BEV、Pointpillar等模型。为了更好地实现车规级,后摩智能基于H30 自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。

屈艳格告诉电子发烧友,虽然相对来说,后摩智能在AI芯片方面算是入局较晚的企业了,但相对传统架构的AI芯片,后摩智能推出这款存算一体架构的H30有它突出的优势。

她总结了三点:1、高计算效率。在相同工艺制程下,它比传统冯诺依曼架构的AI芯片能效比更优,比如,英伟达Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一体芯片物理算力士256TPOS,功耗是35W,它的能效比能够达到7.3TPOS/W。

在当前业界,这样的能效比是相当高的。对于客户来说,这是一款非常有竞争力的产品,因为几乎所有的计算场景,它对功耗的需求都较为敏感,而这款产品在低功耗的情况下,仍然能够实现很高的算力。

2、低计算时延。因为是存算一体架构,这款芯片最大的特点是,在数据传传输过程中不用来回搬运数据,这样的好处是:一、极大地减少功耗,二、延时也会大大减少。后摩智能此前对此做过测算,它跟传统架构的芯片相比,大概会有两倍的延时提升。而这在一些对安全有极高要求的场景,比如智能驾驶,优势会非常明显。

3、低工艺依赖性。因为是存算一体架构,它对先进工艺制程的依赖性并没有那么强,它可以用传统的工艺实现先进工艺才能实现的特点。比如,要实现100TOPS算力,大部分公司会采用比较先进的工艺制程,12nm或者7nm,而后摩智能因为是存算一体架构芯片,可以采用28nm,就能够达到这样的算力。

存算一体架构对工艺的依赖性不强,有其非常大的战略意义。在当前的国际局势下,对于国内的企业来说,如何保障供应链安全很重要。如果真的出现先进制程供应紧张的情况下,存算一体架构芯片仍然能够用一些较成熟的工艺制程生产芯片,同时还能实现较高的算力。

除了发布首款基于SRAM存储介质的H30之外,后摩智能也在探索RRAM存储介质的存算一体芯片。RRAM虽然诞生已久,但在近几年才较多的被关注。相对于来说,RRAM在技术成熟度上不及SRAM,为何后摩智能在成功推出SRAM介质的存算一体芯片之后,又会着手研究RRAM存储介质的存算一体芯片呢?

在采访中,屈艳格详细介绍了不同存储介质的特点,以及后摩智能在存储介质选择上的考量。据她介绍,存算一体芯片有两个很典型的特点:一是大算力,二是低功耗。这两个特点也使得它能实现比较高的能效比。不过从使用来看,重点还是要看哪个是第一个要关注的指标,是大算力,还是低功耗。而后摩智能关注的第一个指标是大算力。

因此在进行存储介质选择的时候,后摩智能会选择更适合做大算力场景的存储介质,比如SRAM、MRAM、RRAM等。因为这些存储介质,可以用来做数字电路,能够用于智能驾驶、智能工业、机器人以及云端大模型推理等场景。而Flash这种存储介质,更适合用在小算力,对功耗要求较高的场景,比如蓝牙耳机、可穿戴手表等。屈艳格介绍说:“因为我们更关注大算力,所以会选择在SRAM、MRAM、RRAM这些存储介质上做技术演进。”

据她介绍,后摩智能当前选择SRAM这个存储介质的主要原因:一是目前SRAM在做大算力方面最为成熟,它可以支持较为先进的工艺制程,读写速度也比较快。二是虽然它是很成熟的存储介质,而在当前的产业界,将它用作存内计算,且算力达到几十TOPS,同时又是做纯数字电路,并且用在工业、智能驾驶场景中的几乎没有。

后摩智能在2021年通过技术验证的流片成功,证明这条技术路径可行,于是便进一步推进,在今年5月推出第一代产品H30。这款基于SRAM的存算一体芯片H30,主要可用在智能驾驶和机器人等领域。屈艳格进一步谈到:“我们下一代还会基于SRAM做存算一体架构优化,包括整个电路、架构的优化,以进一步提升产品性能。按照初步规划,未来会基于SRAM介质研发几款产品,逐步将性能做到最佳。”

当然她也提到,SRAM有它的缺点,比如存储密度相对较低,这样它的芯片面积会有点大,其计算密度相对来说不会太高。因此,后摩智能考虑再选择一些更适合的存储介质,比如MRAM、RRAM这些比较新型的存储器。相对来说,这两款存储介质的读写性能更好,存储密度更大。

屈艳格说:“我们会在这两款介质上做一些技术预研,类似2021年基于SRAM做过的技术验证,等确定行得通之后,再进行下一步的推进,今年8月宣布的初步验证的结果。” 她表示:“我们会根据这些存储介质的成熟性,以及它做存算电路的优势。再根据场景情况,把这个技术从SRAM切换到RRAM或者MRAM上去。”

做透智能驾驶市场,未来希望赋能机器人、云端推理等更多场景

从2020年成立到现在仅三年时间,后摩智能便已经推出第一代SRAM存算一体芯片,同时完成首款RRAM大容量存储芯片的测试。这在做存算一体大算力芯片领域算是相当快了。屈艳格认为,公司在技术和产品推进上能够如此之快,与其完善的团队搭建有关。

后摩智能的团队包括两方面的人才:一部分是在存算一体技术领域有深度研究的人,一部分是在工程落地方面有丰富经验积累的人。在存算方面,后摩智能的团队发布分来自海外知名院校、研究机构和企业,在存算一体、先进存储器方面大概有15年左右的积累。其中一个核心成员,曾经做过六次基于SRAM存算芯片的流片,具有丰富的经验。

这是偏学术方面的经验,另外,后摩智能很好的将这些学术经验与产业界的团队做了结合。后摩智能还组建了一支产业的工程化落地团队,这个团队大部分员工来自AMDIntel,还有华为海思等,具有百万级智驾芯片量产落地经验,学术和产业团队的结合,加速了公司将产品推向商业化落地的进程。

在应用赛道的选择上,后摩智能也做了仔细的考量。据屈艳格介绍,公司成立初期,做了大量的调研,去思考选择什么样的赛道,对数据中心、安防、智能驾驶等都进行了分析。

比如数据中心,这个市场需要大算力,需求量也非常大,尤其是今年大模型迅速发展,未来市场空间会更大。可是分析下来可以发现,数据中心市场90%以上由英伟达的GPU占据,算法迭代快,对英伟达CUDA生态的依赖强。第三方初创企业想进去构建自己的生态,很难。

再比如安防市场,相对来说它对算力的要求比较低,生态依赖度不高,是一个成熟市场。可是,它对算力要求并不高。而后摩智能的核心特点是,容易做大算力的产品,安防市场并不能凸显出公司的优势。

后来确定选择智能驾驶赛道,有两个方面的原因:1、当前智能驾驶是一个发展比较快的行业,每年增速差不多30%以上。尤其现在,我国智能化全球领先,未来市场极其可观。智能驾驶对算力要求很大,L1/L2可能需要几TOPS,到L2++以及未来L4/L5级自动驾驶,它需要的算力会达到上千TOPS,存算一体跟这个市场的需求匹配度很高。

2、虽然智能驾驶现在发展很快,但这个市场刚开始没多长时间。虽然已经有几家巨头企业,包括英伟达、高通、TI,以及国内几家头部企业开始在做,并且取得了不错的成绩。但是相对来说推进的时间还不是很长,整个生态并没有那么成熟,还有去冲刺的机会。

后摩智能推出的首款智能驾驶芯片,是一款通用的产品,它可以像英伟达Orin芯片一样,去适配更多车厂的主流算法。目前已经与新石器、环宇智行等无人车企业达成合作,另外在乘用车方面,也正在与车企业推进测试中。

谈到未来规划,屈艳格表示,公司首先还是会基于SRAM存储介质去进行不断产品优化,面向智能驾驶领域,将这块市场打透,建立起足够高的壁垒。此外还会不断深耕机器人、智能工业、电力、云端推理等领域,去赋能更多的场景。

结尾

可以看到,经过近几年的发展,存算一体已经逐渐在一些场景中得到应用。今年以来,大模型及AIGC迅速发展,它对算力的需求越来越大,而当前传统架构的芯片在性能提升上遇到瓶颈,存算一体在这方面却优势明显,未来将会有很大的应用空间。

虽然存算一体作为一门新技术,在产品和应用的推进上存在挑战。而如今,SRAM已经实现大算力的存算,新型存储介质也在加速推进产业落地。可想而知,未来随着MRAM、RRAM这些新型存储介质的成熟商业化,存算一体的可想像空间将会更大。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SRAM技术
    +关注

    关注

    0

    文章

    4

    浏览量

    1878
收藏 人收藏

    评论

    相关推荐

    开源芯片系列讲座第24期:基于SRAM的高效计算架构

    鹭岛论坛开源芯片系列讲座第24期「基于SRAM的高效计算架构」明晚(27日)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目基于
    的头像 发表于 11-27 01:05 209次阅读
    开源<b class='flag-5'>芯片</b>系列讲座第24期:基于<b class='flag-5'>SRAM</b><b class='flag-5'>存</b><b class='flag-5'>算</b>的高效计算架构

    直播预约 |开源芯片系列讲座第24期:SRAM一体高能效RISC-V计算

    鹭岛论坛开源芯片系列讲座第24期「SRAM一体
    的头像 发表于 11-16 01:10 182次阅读
    直播预约 |开源<b class='flag-5'>芯片</b>系列讲座第24期:<b class='flag-5'>SRAM</b><b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>:<b class='flag-5'>赋</b><b class='flag-5'>能</b>高能效RISC-V计算

    一体化与边缘计算:重新定义智能计算的未来

    、人工智能(AI)等技术的发展,数据量的分布性、实时性需求增加,边缘计算也逐渐概念走向落地。本文介绍
    的头像 发表于 11-12 01:05 211次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>化与边缘计算:重新定义<b class='flag-5'>智能</b>计算的未来

    一体架构创新助力国产大AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《一体架构创新助力国产大
    的头像 发表于 10-23 14:48 284次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    、GPU、NPU,给我们剖析了芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者更好理解
    发表于 10-15 22:08

    科技新突破:首款支持多模态一体AI芯片成功问世

    一体介质,通过存储单元和计算单元的深度融合,采用22nm成熟工艺制程,有效把控制造成本。与传统架构下的AI芯片相比,该款芯片
    发表于 09-26 13:51 401次阅读
    科技新突破:首款支持多模态<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>AI<b class='flag-5'>芯片</b>成功问世

    苹芯科技引领存一体技术革新 PIMCHIP系列芯片重塑AI计算新格局

    一体NPU和PIMCHIP-S300多模态智能感知芯片,以前沿技术加持AI与大模型推理加速等各类计算任务场景,为高能效应用开启新纪元。 
    发表于 08-08 17:21 251次阅读
    苹芯科技引领存<b class='flag-5'>算</b><b class='flag-5'>一体</b>技术革新   PIMCHIP系列<b class='flag-5'>芯片</b>重塑AI计算新格局

    后摩智能推出边端大模型AI芯片M30,展现出一体架构优势

    了基于M30芯片的智模组(SoM)和谋®️AI加速卡。   后摩智能
    的头像 发表于 07-03 00:58 4185次阅读

    科技助力AI应用落地:WTMDK2101-ZT1评估板实地评测与性能揭秘

    为未来计算设备和系统带来革命性变革,使其更加智能、高效和可靠。 这些年里,基于不同存储介质的一体芯片研究不断涌现,包括
    发表于 05-16 16:38

    探索内计算—基于 SRAM内计算与基于 MRAM 的一体的探究

    本文深入探讨了基于SRAM和MRAM的一体技术在计算领域的应用和发展。首先,介绍了基于SRAM
    的头像 发表于 05-16 16:10 2783次阅读
    探索<b class='flag-5'>存</b>内计算—基于 <b class='flag-5'>SRAM</b> 的<b class='flag-5'>存</b>内计算与基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>的探究

    聚焦全国一体体系构建,忆联以强大“引擎”释放潜能

    是数字时代的生产,为数字经济与实体经济深度融合提供了强大支持。在不久前结束的全国两会中,“全国一体
    的头像 发表于 03-22 18:13 524次阅读
    聚焦全国<b class='flag-5'>一体</b>化<b class='flag-5'>算</b><b class='flag-5'>力</b>体系构建,忆联以强大<b class='flag-5'>存</b><b class='flag-5'>力</b>“引擎”释放<b class='flag-5'>算</b><b class='flag-5'>力</b>潜能

    iBeLink KS MAX 10.5T大领跑KAS新领域

    有8G的显存,可以处理复杂的算法,提高挖掘稳定性。iBeLink ks max10.5T的超大特点是它的高效节能,它采用了先进的“一体”高通量
    发表于 02-20 16:11

    什么是通感一体化?通感一体化的应用场景

    通感一体化可广泛应用于智能家居、智慧城市、智慧交通、医疗健康等方面。文档君为大家搜集了些典型的应用场景。 智能家居 通感
    发表于 01-18 16:12 1.1w次阅读
    什么是通感<b class='flag-5'>算</b><b class='flag-5'>一体</b>化?通感<b class='flag-5'>算</b><b class='flag-5'>一体</b>化的应用场景

    一体芯片如何支持Transformer等不同模型?

    后摩智能致力于打造通用人工智能芯片,自主研发的一体芯片
    的头像 发表于 01-05 14:14 1339次阅读

    SRAM一体芯片的研究现状和发展趋势

    人工智能时代对计算芯片效都提出了极高要求。
    的头像 发表于 01-02 11:02 2420次阅读
    <b class='flag-5'>SRAM</b><b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>芯片</b>的研究现状和发展趋势