电子发烧友网报道(文/李弯弯)近几年,随着物联网、人工智能等技术的发展,算力的需求越来越大。而在冯诺依曼架构下,芯片性能的提升遇到瓶颈。业界开始不断探索新的技术形式,因为具备大算力、低功耗的特点,存算一体架构芯片应运而生。
后摩智能是一家致力于存算一体大算力芯片研发的企业,成立于2020年。今年5月,该公司发布了首款SRAM存算一体智驾芯片后摩鸿途™H30,这也是全球首款面向智能驾驶领域的存算一体芯片。此外,今年8月该公司宣布完成首款RRAM存算芯片的测试,可以说在存算一体大算力方面进展迅速。
近日,电子发烧友采访到后摩智能公共事务部负责人屈艳格,就其在存储介质及应用赛道的选择,存算一体发展趋势及后摩智能未来规划方面做了探讨。
从SRAM到RRAM,后摩智能是如何选择存储介质的
后摩智能今年5月推出的首款存算一体智驾芯片H30,最高物理算力256TOPS,典型功耗35W。该芯片基于SRAM存储介质,采用数字存算一体架构,拥有极低访存功耗和超高计算密度,仅用12nm工艺制程,在Int8数据精度下,其AI核心IPU能效比达15Tops/W,是传统架构芯片7倍以上。
据了解,H30已成功运行CV类的经典网络,以及自动驾驶领域先进的BEV、Pointpillar等模型。为了更好地实现车规级,后摩智能基于H30 自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。
屈艳格告诉电子发烧友,虽然相对来说,后摩智能在AI芯片方面算是入局较晚的企业了,但相对传统架构的AI芯片,后摩智能推出这款存算一体架构的H30有它突出的优势。
她总结了三点:1、高计算效率。在相同工艺制程下,它比传统冯诺依曼架构的AI芯片能效比更优,比如,英伟达Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一体芯片物理算力士256TPOS,功耗是35W,它的能效比能够达到7.3TPOS/W。
在当前业界,这样的能效比是相当高的。对于客户来说,这是一款非常有竞争力的产品,因为几乎所有的计算场景,它对功耗的需求都较为敏感,而这款产品在低功耗的情况下,仍然能够实现很高的算力。
2、低计算时延。因为是存算一体架构,这款芯片最大的特点是,在数据传传输过程中不用来回搬运数据,这样的好处是:一、极大地减少功耗,二、延时也会大大减少。后摩智能此前对此做过测算,它跟传统架构的芯片相比,大概会有两倍的延时提升。而这在一些对安全有极高要求的场景,比如智能驾驶,优势会非常明显。
3、低工艺依赖性。因为是存算一体架构,它对先进工艺制程的依赖性并没有那么强,它可以用传统的工艺实现先进工艺才能实现的特点。比如,要实现100TOPS算力,大部分公司会采用比较先进的工艺制程,12nm或者7nm,而后摩智能因为是存算一体架构芯片,可以采用28nm,就能够达到这样的算力。
存算一体架构对工艺的依赖性不强,有其非常大的战略意义。在当前的国际局势下,对于国内的企业来说,如何保障供应链安全很重要。如果真的出现先进制程供应紧张的情况下,存算一体架构芯片仍然能够用一些较成熟的工艺制程生产芯片,同时还能实现较高的算力。
除了发布首款基于SRAM存储介质的H30之外,后摩智能也在探索RRAM存储介质的存算一体芯片。RRAM虽然诞生已久,但在近几年才较多的被关注。相对于来说,RRAM在技术成熟度上不及SRAM,为何后摩智能在成功推出SRAM介质的存算一体芯片之后,又会着手研究RRAM存储介质的存算一体芯片呢?
在采访中,屈艳格详细介绍了不同存储介质的特点,以及后摩智能在存储介质选择上的考量。据她介绍,存算一体芯片有两个很典型的特点:一是大算力,二是低功耗。这两个特点也使得它能实现比较高的能效比。不过从使用来看,重点还是要看哪个是第一个要关注的指标,是大算力,还是低功耗。而后摩智能关注的第一个指标是大算力。
因此在进行存储介质选择的时候,后摩智能会选择更适合做大算力场景的存储介质,比如SRAM、MRAM、RRAM等。因为这些存储介质,可以用来做数字电路,能够用于智能驾驶、智能工业、机器人以及云端大模型推理等场景。而Flash这种存储介质,更适合用在小算力,对功耗要求较高的场景,比如蓝牙耳机、可穿戴手表等。屈艳格介绍说:“因为我们更关注大算力,所以会选择在SRAM、MRAM、RRAM这些存储介质上做技术演进。”
据她介绍,后摩智能当前选择SRAM这个存储介质的主要原因:一是目前SRAM在做大算力方面最为成熟,它可以支持较为先进的工艺制程,读写速度也比较快。二是虽然它是很成熟的存储介质,而在当前的产业界,将它用作存内计算,且算力达到几十TOPS,同时又是做纯数字电路,并且用在工业、智能驾驶场景中的几乎没有。
后摩智能在2021年通过技术验证的流片成功,证明这条技术路径可行,于是便进一步推进,在今年5月推出第一代产品H30。这款基于SRAM的存算一体芯片H30,主要可用在智能驾驶和机器人等领域。屈艳格进一步谈到:“我们下一代还会基于SRAM做存算一体架构优化,包括整个电路、架构的优化,以进一步提升产品性能。按照初步规划,未来会基于SRAM介质研发几款产品,逐步将性能做到最佳。”
当然她也提到,SRAM有它的缺点,比如存储密度相对较低,这样它的芯片面积会有点大,其计算密度相对来说不会太高。因此,后摩智能考虑再选择一些更适合的存储介质,比如MRAM、RRAM这些比较新型的存储器。相对来说,这两款存储介质的读写性能更好,存储密度更大。
屈艳格说:“我们会在这两款介质上做一些技术预研,类似2021年基于SRAM做过的技术验证,等确定行得通之后,再进行下一步的推进,今年8月宣布的初步验证的结果。” 她表示:“我们会根据这些存储介质的成熟性,以及它做存算电路的优势。再根据场景情况,把这个技术从SRAM切换到RRAM或者MRAM上去。”
做透智能驾驶市场,未来希望赋能机器人、云端推理等更多场景
从2020年成立到现在仅三年时间,后摩智能便已经推出第一代SRAM存算一体芯片,同时完成首款RRAM大容量存储芯片的测试。这在做存算一体大算力芯片领域算是相当快了。屈艳格认为,公司在技术和产品推进上能够如此之快,与其完善的团队搭建有关。
后摩智能的团队包括两方面的人才:一部分是在存算一体技术领域有深度研究的人,一部分是在工程落地方面有丰富经验积累的人。在存算方面,后摩智能的团队发布分来自海外知名院校、研究机构和企业,在存算一体、先进存储器方面大概有15年左右的积累。其中一个核心成员,曾经做过六次基于SRAM存算芯片的流片,具有丰富的经验。
这是偏学术方面的经验,另外,后摩智能很好的将这些学术经验与产业界的团队做了结合。后摩智能还组建了一支产业的工程化落地团队,这个团队大部分员工来自AMD、Intel,还有华为海思等,具有百万级智驾芯片量产落地经验,学术和产业团队的结合,加速了公司将产品推向商业化落地的进程。
在应用赛道的选择上,后摩智能也做了仔细的考量。据屈艳格介绍,公司成立初期,做了大量的调研,去思考选择什么样的赛道,对数据中心、安防、智能驾驶等都进行了分析。
比如数据中心,这个市场需要大算力,需求量也非常大,尤其是今年大模型迅速发展,未来市场空间会更大。可是分析下来可以发现,数据中心市场90%以上由英伟达的GPU占据,算法迭代快,对英伟达CUDA生态的依赖强。第三方初创企业想进去构建自己的生态,很难。
再比如安防市场,相对来说它对算力的要求比较低,生态依赖度不高,是一个成熟市场。可是,它对算力要求并不高。而后摩智能的核心特点是,容易做大算力的产品,安防市场并不能凸显出公司的优势。
后来确定选择智能驾驶赛道,有两个方面的原因:1、当前智能驾驶是一个发展比较快的行业,每年增速差不多30%以上。尤其现在,我国智能化全球领先,未来市场极其可观。智能驾驶对算力要求很大,L1/L2可能需要几TOPS,到L2++以及未来L4/L5级自动驾驶,它需要的算力会达到上千TOPS,存算一体跟这个市场的需求匹配度很高。
2、虽然智能驾驶现在发展很快,但这个市场刚开始没多长时间。虽然已经有几家巨头企业,包括英伟达、高通、TI,以及国内几家头部企业开始在做,并且取得了不错的成绩。但是相对来说推进的时间还不是很长,整个生态并没有那么成熟,还有去冲刺的机会。
后摩智能推出的首款智能驾驶芯片,是一款通用的产品,它可以像英伟达Orin芯片一样,去适配更多车厂的主流算法。目前已经与新石器、环宇智行等无人车企业达成合作,另外在乘用车方面,也正在与车企业推进测试中。
谈到未来规划,屈艳格表示,公司首先还是会基于SRAM存储介质去进行不断产品优化,面向智能驾驶领域,将这块市场打透,建立起足够高的壁垒。此外还会不断深耕机器人、智能工业、电力、云端推理等领域,去赋能更多的场景。
结尾
可以看到,经过近几年的发展,存算一体已经逐渐在一些场景中得到应用。今年以来,大模型及AIGC迅速发展,它对算力的需求越来越大,而当前传统架构的芯片在性能提升上遇到瓶颈,存算一体在这方面却优势明显,未来将会有很大的应用空间。
虽然存算一体作为一门新技术,在产品和应用的推进上存在挑战。而如今,SRAM已经实现大算力的存算,新型存储介质也在加速推进产业落地。可想而知,未来随着MRAM、RRAM这些新型存储介质的成熟商业化,存算一体的可想像空间将会更大。
后摩智能是一家致力于存算一体大算力芯片研发的企业,成立于2020年。今年5月,该公司发布了首款SRAM存算一体智驾芯片后摩鸿途™H30,这也是全球首款面向智能驾驶领域的存算一体芯片。此外,今年8月该公司宣布完成首款RRAM存算芯片的测试,可以说在存算一体大算力方面进展迅速。
近日,电子发烧友采访到后摩智能公共事务部负责人屈艳格,就其在存储介质及应用赛道的选择,存算一体发展趋势及后摩智能未来规划方面做了探讨。
从SRAM到RRAM,后摩智能是如何选择存储介质的
后摩智能今年5月推出的首款存算一体智驾芯片H30,最高物理算力256TOPS,典型功耗35W。该芯片基于SRAM存储介质,采用数字存算一体架构,拥有极低访存功耗和超高计算密度,仅用12nm工艺制程,在Int8数据精度下,其AI核心IPU能效比达15Tops/W,是传统架构芯片7倍以上。
据了解,H30已成功运行CV类的经典网络,以及自动驾驶领域先进的BEV、Pointpillar等模型。为了更好地实现车规级,后摩智能基于H30 自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。
屈艳格告诉电子发烧友,虽然相对来说,后摩智能在AI芯片方面算是入局较晚的企业了,但相对传统架构的AI芯片,后摩智能推出这款存算一体架构的H30有它突出的优势。
她总结了三点:1、高计算效率。在相同工艺制程下,它比传统冯诺依曼架构的AI芯片能效比更优,比如,英伟达Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一体芯片物理算力士256TPOS,功耗是35W,它的能效比能够达到7.3TPOS/W。
在当前业界,这样的能效比是相当高的。对于客户来说,这是一款非常有竞争力的产品,因为几乎所有的计算场景,它对功耗的需求都较为敏感,而这款产品在低功耗的情况下,仍然能够实现很高的算力。
2、低计算时延。因为是存算一体架构,这款芯片最大的特点是,在数据传传输过程中不用来回搬运数据,这样的好处是:一、极大地减少功耗,二、延时也会大大减少。后摩智能此前对此做过测算,它跟传统架构的芯片相比,大概会有两倍的延时提升。而这在一些对安全有极高要求的场景,比如智能驾驶,优势会非常明显。
3、低工艺依赖性。因为是存算一体架构,它对先进工艺制程的依赖性并没有那么强,它可以用传统的工艺实现先进工艺才能实现的特点。比如,要实现100TOPS算力,大部分公司会采用比较先进的工艺制程,12nm或者7nm,而后摩智能因为是存算一体架构芯片,可以采用28nm,就能够达到这样的算力。
存算一体架构对工艺的依赖性不强,有其非常大的战略意义。在当前的国际局势下,对于国内的企业来说,如何保障供应链安全很重要。如果真的出现先进制程供应紧张的情况下,存算一体架构芯片仍然能够用一些较成熟的工艺制程生产芯片,同时还能实现较高的算力。
除了发布首款基于SRAM存储介质的H30之外,后摩智能也在探索RRAM存储介质的存算一体芯片。RRAM虽然诞生已久,但在近几年才较多的被关注。相对于来说,RRAM在技术成熟度上不及SRAM,为何后摩智能在成功推出SRAM介质的存算一体芯片之后,又会着手研究RRAM存储介质的存算一体芯片呢?
在采访中,屈艳格详细介绍了不同存储介质的特点,以及后摩智能在存储介质选择上的考量。据她介绍,存算一体芯片有两个很典型的特点:一是大算力,二是低功耗。这两个特点也使得它能实现比较高的能效比。不过从使用来看,重点还是要看哪个是第一个要关注的指标,是大算力,还是低功耗。而后摩智能关注的第一个指标是大算力。
因此在进行存储介质选择的时候,后摩智能会选择更适合做大算力场景的存储介质,比如SRAM、MRAM、RRAM等。因为这些存储介质,可以用来做数字电路,能够用于智能驾驶、智能工业、机器人以及云端大模型推理等场景。而Flash这种存储介质,更适合用在小算力,对功耗要求较高的场景,比如蓝牙耳机、可穿戴手表等。屈艳格介绍说:“因为我们更关注大算力,所以会选择在SRAM、MRAM、RRAM这些存储介质上做技术演进。”
据她介绍,后摩智能当前选择SRAM这个存储介质的主要原因:一是目前SRAM在做大算力方面最为成熟,它可以支持较为先进的工艺制程,读写速度也比较快。二是虽然它是很成熟的存储介质,而在当前的产业界,将它用作存内计算,且算力达到几十TOPS,同时又是做纯数字电路,并且用在工业、智能驾驶场景中的几乎没有。
后摩智能在2021年通过技术验证的流片成功,证明这条技术路径可行,于是便进一步推进,在今年5月推出第一代产品H30。这款基于SRAM的存算一体芯片H30,主要可用在智能驾驶和机器人等领域。屈艳格进一步谈到:“我们下一代还会基于SRAM做存算一体架构优化,包括整个电路、架构的优化,以进一步提升产品性能。按照初步规划,未来会基于SRAM介质研发几款产品,逐步将性能做到最佳。”
当然她也提到,SRAM有它的缺点,比如存储密度相对较低,这样它的芯片面积会有点大,其计算密度相对来说不会太高。因此,后摩智能考虑再选择一些更适合的存储介质,比如MRAM、RRAM这些比较新型的存储器。相对来说,这两款存储介质的读写性能更好,存储密度更大。
屈艳格说:“我们会在这两款介质上做一些技术预研,类似2021年基于SRAM做过的技术验证,等确定行得通之后,再进行下一步的推进,今年8月宣布的初步验证的结果。” 她表示:“我们会根据这些存储介质的成熟性,以及它做存算电路的优势。再根据场景情况,把这个技术从SRAM切换到RRAM或者MRAM上去。”
做透智能驾驶市场,未来希望赋能机器人、云端推理等更多场景
从2020年成立到现在仅三年时间,后摩智能便已经推出第一代SRAM存算一体芯片,同时完成首款RRAM大容量存储芯片的测试。这在做存算一体大算力芯片领域算是相当快了。屈艳格认为,公司在技术和产品推进上能够如此之快,与其完善的团队搭建有关。
后摩智能的团队包括两方面的人才:一部分是在存算一体技术领域有深度研究的人,一部分是在工程落地方面有丰富经验积累的人。在存算方面,后摩智能的团队发布分来自海外知名院校、研究机构和企业,在存算一体、先进存储器方面大概有15年左右的积累。其中一个核心成员,曾经做过六次基于SRAM存算芯片的流片,具有丰富的经验。
这是偏学术方面的经验,另外,后摩智能很好的将这些学术经验与产业界的团队做了结合。后摩智能还组建了一支产业的工程化落地团队,这个团队大部分员工来自AMD、Intel,还有华为海思等,具有百万级智驾芯片量产落地经验,学术和产业团队的结合,加速了公司将产品推向商业化落地的进程。
在应用赛道的选择上,后摩智能也做了仔细的考量。据屈艳格介绍,公司成立初期,做了大量的调研,去思考选择什么样的赛道,对数据中心、安防、智能驾驶等都进行了分析。
比如数据中心,这个市场需要大算力,需求量也非常大,尤其是今年大模型迅速发展,未来市场空间会更大。可是分析下来可以发现,数据中心市场90%以上由英伟达的GPU占据,算法迭代快,对英伟达CUDA生态的依赖强。第三方初创企业想进去构建自己的生态,很难。
再比如安防市场,相对来说它对算力的要求比较低,生态依赖度不高,是一个成熟市场。可是,它对算力要求并不高。而后摩智能的核心特点是,容易做大算力的产品,安防市场并不能凸显出公司的优势。
后来确定选择智能驾驶赛道,有两个方面的原因:1、当前智能驾驶是一个发展比较快的行业,每年增速差不多30%以上。尤其现在,我国智能化全球领先,未来市场极其可观。智能驾驶对算力要求很大,L1/L2可能需要几TOPS,到L2++以及未来L4/L5级自动驾驶,它需要的算力会达到上千TOPS,存算一体跟这个市场的需求匹配度很高。
2、虽然智能驾驶现在发展很快,但这个市场刚开始没多长时间。虽然已经有几家巨头企业,包括英伟达、高通、TI,以及国内几家头部企业开始在做,并且取得了不错的成绩。但是相对来说推进的时间还不是很长,整个生态并没有那么成熟,还有去冲刺的机会。
后摩智能推出的首款智能驾驶芯片,是一款通用的产品,它可以像英伟达Orin芯片一样,去适配更多车厂的主流算法。目前已经与新石器、环宇智行等无人车企业达成合作,另外在乘用车方面,也正在与车企业推进测试中。
谈到未来规划,屈艳格表示,公司首先还是会基于SRAM存储介质去进行不断产品优化,面向智能驾驶领域,将这块市场打透,建立起足够高的壁垒。此外还会不断深耕机器人、智能工业、电力、云端推理等领域,去赋能更多的场景。
结尾
可以看到,经过近几年的发展,存算一体已经逐渐在一些场景中得到应用。今年以来,大模型及AIGC迅速发展,它对算力的需求越来越大,而当前传统架构的芯片在性能提升上遇到瓶颈,存算一体在这方面却优势明显,未来将会有很大的应用空间。
虽然存算一体作为一门新技术,在产品和应用的推进上存在挑战。而如今,SRAM已经实现大算力的存算,新型存储介质也在加速推进产业落地。可想而知,未来随着MRAM、RRAM这些新型存储介质的成熟商业化,存算一体的可想像空间将会更大。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
SRAM技术
+关注
关注
0文章
4浏览量
1876
发布评论请先 登录
相关推荐
存算一体架构创新助力国产大算力AI芯片腾飞
在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《存算一体架构创新助力国产大算
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览
、GPU、NPU,给我们剖析了算力芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解
发表于 10-15 22:08
科技新突破:首款支持多模态存算一体AI芯片成功问世
存算一体介质,通过存储单元和计算单元的深度融合,采用22nm成熟工艺制程,有效把控制造成本。与传统架构下的AI芯片相比,该款芯片在
发表于 09-26 13:51
•344次阅读
苹芯科技引领存算一体技术革新 PIMCHIP系列芯片重塑AI计算新格局
一体NPU和PIMCHIP-S300多模态智能感知芯片,以前沿技术加持AI与大模型推理加速等各类计算任务场景,为高能效算力应用开启新纪元。
发表于 08-08 17:21
•229次阅读
知存科技助力AI应用落地:WTMDK2101-ZT1评估板实地评测与性能揭秘
为未来计算设备和系统带来革命性变革,使其更加智能、高效和可靠。
这些年里,基于不同存储介质的存算一体芯片研究不断涌现,包括
发表于 05-16 16:38
什么是通感算一体化?通感算一体化的应用场景
通感算一体化可广泛应用于智能家居、智慧城市、智慧交通、医疗健康等方面。文档君为大家搜集了一些典型的应用场景。 智能家居 通感
发表于 01-18 16:12
•1.1w次阅读
评论