0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

或让功耗降低1000倍,存算一体芯片正在突破

Carol Li 来源:电子发烧友网 作者:李弯弯 2020-12-22 08:29 次阅读

电子发烧友网报道(文/李弯弯)为什么存算一体化越来越受到关注?今年1月,在阿里达摩院发布的2020十大科技趋势中,其中一个是,计算存储一体化突破AI算力瓶颈。

根据该趋势预判,冯诺伊曼架构的存储和计算分离,已经不适合数据驱动的人工智能应用需求,频繁的数据搬运导致的算力瓶颈以及功耗瓶颈已经成为对更先进算法探索的限制因素。

类似于脑神经结构的存内计算架构将数据存储单元和计算单元融合为一体,能显著减少数据搬运,极大提高计算并行度和能效。计算存储一体化在硬件架构方面的革新,将突破AI算力瓶颈。

当前,有不少科研团队和芯片企业投入到存储一体芯片的研发中,并且时常传出新进展,比如,上个月,瑞士洛桑联邦理工学院设计出了一种兼具逻辑运算和数据存储功能的计算机芯片,近日有消息显示,知存科技已经研发了三款存算一体芯片,并且其中一款已小批量生产。


存算一体可极大降低功耗,提升运算效率

存算一体,即在存储器颗粒本身进行算法嵌入,在存储颗粒内实现计算。众所周知,我们当前的计算机采用冯诺依曼体系结构,计算和存储功能是分离的,分别由中央处理器CPU和存储器完成。

CPU和存储器通过总线互连通信,CPU从存储器读出数据,完成计算,然后将结果写回存储器。冯诺依曼架构以CPU为核心,其他部件都是为CPU服务。

冯诺依曼架构图


但是,因为处理器和存储器工艺、封装各不相同,两者的性能差距随着时间不断拉大,存储器数据访问速度跟不上CPU的数据处理速度,导致了“存储墙”问题越来越严重。



数据显示,从 1980年到 2000年,处理器和存储器的速度失配以每年50%的速率增加。通过不断的探索,业界认为,存算一体技术可以达到弱化或消除“存储墙”问题。

关于存储墙的问题,知存科技创始人兼CEO王绍迪近日在某活动上的讲述更为形象,他说:计算本身消耗的功耗并不多,但数据从内存搬到计算单元会消耗将近1000倍的计算功耗。

可见,存算一体可以完美的避开搬运产生的极大功耗,事实上,与传统技术相比,存算一体还有运算效率高、速度快和成本低的特点,非常受市场需求端看好。

存算一体芯片虽研发困难,但仍有进展

虽然从应用端来看,存算一体芯片会给很多行业、设备带来更高效的运算和更低的功耗,但是其技术的实现却没有那么容易,事实上,很多团队已经在这个领域钻研很多年,才最终取得一些进展。

知存科技创始人兼CEO王绍迪就透露,该公司的创始团队研发存算一体八年,流片次数接近20次。虽然当前知存科技已经有芯片进行小批量生产,但是从开发的时间来看,投入是相当大的,可见技术实现的不容易。

不过虽然困难,是所谓,市场需求推动技术进步,在科学界和企业界不断努力研发下,未来发展还是值得期待。事实上,当前已经不少技术和产品初见成效。

新一代计算机芯片实现存算一体

就在上个月,有报道称,瑞士洛桑联邦理工学院的工程师设计了一种兼具逻辑运算和数据存储功能的计算机芯片。

就如上文所言,现在的主流计算机,处理器和存储芯片都是分离的,一直沿用冯诺依曼五十多年前确立的架构,在工作的时候,两个单元之间需要频繁地交换数据,消耗很大一部分时间和能量。

根据报道,这个研究组首次使用一种只有3个原子厚的平面材料——二硫化钼(MoS2),进行创新设计,集逻辑运算和存储功能为一体,大幅减少传统设计中数据交换的损耗。

该团队主要研究员Andras Kis说:“该款芯片可以减少存储单元和处理单元之间数据传输的能量消耗,缩短了运算时间,缩小芯片占用的空间。”

可以预见,这款芯片如果最后能够实现商用,将会为制造体积更小、更节能、处理速度更快的电脑,以及人工智能的发展铺平道路。

科学家成功研制存算一体通用AI芯片

另外,密歇根大学卢伟教授及其团队在去年也成功研发出过一款基于忆阻器阵列的通用 AI 芯片,忆阻器即同时兼备记忆和电阻的功能,是神经形态计算实现的关键。

根据报道,这款新型 AI 芯片将所有存储计算功能集成在同一芯片上,真正实现了存算一体化,而且可以通过编程应用于多种人工智能算法,进一步提高计算速度,并减少能量损耗。

卢伟教授当时在接受媒体采访的时候表示,这种新型 AI 芯片很适合切入的一个应用场景是基于推理的边缘计算场景。

知存科技存算一体AI芯片已经小批量试产

知存科技成立于2017年10月,专注研发基于存算一体先进技术的人工智能芯片。根据官网介绍,该公司的创始成员来自国际上最早研发存算一体技术的专家团队,并在2016年实现了全球第一款存算一体AI芯片。

当前,知存科技已经完成研发了两款智能语音芯片:WTM1001和WTM2101,其中WTM1001是全球第一个存算一体芯片产品,并且已经进入小批量生产阶段。WTM2101预计明年Q1进行正式的小批量试产。另外该公司还有一款面向视觉应用的芯片WTM3213,正在研发。

在存算一体技术的推进过程中,知存科技可谓是走在前列,凭借优秀的技术实力,成立三年时间,公司已经过得数亿元融资,加入芯片量产。

闪亿半导体计划3年内完成首款芯片推广及量产

闪亿半导体成立于2017年7月,是闪易半导体的全资子公司。

据官网介绍,闪易半导体是一家研发高性能、低功耗、低成本的存算一体化AI芯片的集成电路公司,团队成员分别毕业于清华大学和北京大学,分别在中美两国的电路设计生产、人工智能开发企业担任研发负责人。

该公司表示,计划在三年内完成第一代语音产品在家电和物联网领域的推广和量产,同时设计和开发好第二代产品,用于图像识别及安防领域。

闪亿半导体于2019年10月发布了其首款存算一体化芯片产品,该公司负责人鲁辞莽当时表示,这款芯片在运行效率上能提高超过10TOPS/W,成本可以比传统AI芯片方案下降超一半。

恒烁半导体积极推进存算一体芯片商用

据合肥日报报道,NOR Flash厂商恒烁半导体与中国科大团队在2019年7月完成了历时两年研发的基于NOR闪存架构的存算一体AI芯片系统演示。

根据报道,这是一款具有边缘计算和推理的AI芯片,能实时检测通过摄像头拍摄的人脸头像并给出计算概率,准确且稳定。可广泛应用于森林防火中的人脸识别与救援、心电图的实时监测、人工智能在人脸识别上的硬件解决方案等。

据研发团队成员之一、中国科大博士陶临风介绍,相较于传统芯片,存算一体人工智能芯片具有能耗低、运算效率高、速度快和成本低的特点。

电子发烧友了解到,恒烁半导体目前存算一体方面暂时还无更多进展,不过公司一直在积极推动存算一体AI芯片商用。

小结

根据上述各家推出的芯片,存算一体芯片的优势基本体现在,低能耗、高效率、成本低等优点,在音频、图像等人工智能领域有很好的应用,并且凭借其优势,在一些传统设备中可以有更多创新性的应用,虽然研发困难,但是市场需求看好,科学界和企业界都在持续积极研发,并逐渐取得突破性进展,存算一体芯片的发展未来值得期待。

本文由电子发烧友网原创,未经授权禁止转载。如需转载,请添加微信号elecfans999。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    452

    文章

    50179

    浏览量

    420662
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10802

    浏览量

    210760
  • 冯诺伊曼架构

    关注

    1

    文章

    11

    浏览量

    9914
  • 存算一体
    +关注

    关注

    0

    文章

    100

    浏览量

    4273
收藏 人收藏

    评论

    相关推荐

    一体架构创新助力国产大力AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《一体架构创新助力国产大
    的头像 发表于 10-23 14:48 193次阅读

    科技新突破:首款支持多模态一体AI芯片成功问世

    一体介质,通过存储单元和计算单元的深度融合,采用22nm成熟工艺制程,有效把控制造成本。与传统架构下的AI芯片相比,该款芯片
    发表于 09-26 13:51 315次阅读
    科技新<b class='flag-5'>突破</b>:首款支持多模态<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>AI<b class='flag-5'>芯片</b>成功问世

    后摩智能首款一体智驾芯片获评突出创新产品奖

    近日,2024年6月29日,由深圳市汽车电子行业协会主办的「第十三届国际汽车电子产业峰会暨2023年度汽车电子科学技术奖颁奖典礼」在深圳宝安隆重举行。后摩智能首款一体智驾芯片——后
    的头像 发表于 09-24 16:51 423次阅读

    苹芯科技引领存一体技术革新 PIMCHIP系列芯片重塑AI计算新格局

    智能芯片国产化再传利好,8月8日,国际领先的一体芯片开拓者——苹芯科技在北京召开 “
    发表于 08-08 17:21 212次阅读
    苹芯科技引领存<b class='flag-5'>算</b><b class='flag-5'>一体</b>技术革新   PIMCHIP系列<b class='flag-5'>芯片</b>重塑AI计算新格局

    后摩智能推出边端大模型AI芯片M30,展现出一体架构优势

    了基于M30芯片的智模组(SoM)和力谋®️AI加速卡。   后摩智能一体架构芯片产品  
    的头像 发表于 07-03 00:58 4041次阅读

    科技助力AI应用落地:WTMDK2101-ZT1评估板实地评测与性能揭秘

    晶体管的内计算在深度学习应用中的效用。相较于传统冯诺伊曼架构的传统方案,PRIME可以实现功耗降低约20、速度提升约50,引起产业界广
    发表于 05-16 16:38

    探索内计算—基于 SRAM 的内计算与基于 MRAM 的一体的探究

    本文深入探讨了基于SRAM和MRAM的一体技术在计算领域的应用和发展。首先,介绍了基于SRAM的内逻辑计算技术,包括其原理、优势以及在神经网络领域的应用。其次,详细讨论了基于MR
    的头像 发表于 05-16 16:10 2365次阅读
    探索<b class='flag-5'>存</b>内计算—基于 SRAM 的<b class='flag-5'>存</b>内计算与基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>的探究

    科技携手北大共建一体化技术实验室,推动AI创新

    揭牌仪式结束后,王绍迪在北大集成电路学院举办的“未名·芯”论坛上做了主题演讲,分享了他对于多模态大模型时代内计算发展的见解。他强调了一体在人工智能领域的重要性及其未来发展趋势。
    的头像 发表于 05-08 17:25 844次阅读

    北京大学-知科技一体联合实验室揭牌,开启知科技产学研融合战略新升级

    5月5日,“北京大学-知科技一体技术联合实验室”在北京大学微纳电子大厦正式揭牌,北京大学集成电路学院院长蔡茂、北京大学集成电路学院副
    的头像 发表于 05-07 19:31 1337次阅读
    北京大学-知<b class='flag-5'>存</b>科技<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>联合实验室揭牌,开启知<b class='flag-5'>存</b>科技产学研融合战略新升级

    什么是通感一体化?通感一体化的应用场景

    通感一体化可广泛应用于智能家居、智慧城市、智慧交通、医疗健康等方面。文档君为大家搜集了些典型的应用场景。 智能家居 通感一体化利用基站
    发表于 01-18 16:12 1w次阅读
    什么是通感<b class='flag-5'>算</b><b class='flag-5'>一体</b>化?通感<b class='flag-5'>算</b><b class='flag-5'>一体</b>化的应用场景

    一体”是大模型AI芯片的破局关键?

    英特尔的研究表明,当半导体工艺达到 7nm 时,数据搬运功耗高达 35pJ/bit,占总功耗的63.7%。另有统计表明,在大力的AI应用中,数据搬运操作消耗90%的时间和功耗,数据搬
    的头像 发表于 01-14 13:54 808次阅读

    一体芯片如何支持Transformer等不同模型?

    后摩智能致力于打造通用人工智能芯片,自主研发的一体芯片在支持各类模型方面表现突出,包括YOLO系列网络、BEV系列网络、点云系列网络等。
    的头像 发表于 01-05 14:14 1255次阅读

    SRAM一体芯片的研究现状和发展趋势

    人工智能时代对计算芯片力和能效都提出了极高要求。一体芯片技术被认为是有望解决处理器
    的头像 发表于 01-02 11:02 2245次阅读
    SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>芯片</b>的研究现状和发展趋势

    浅谈为AI大力而生的-芯片

    大模型爆火之后,一体获得了更多的关注与机会,其原因之是因为
    发表于 12-06 15:00 353次阅读
    浅谈为AI大<b class='flag-5'>算</b>力而生的<b class='flag-5'>存</b><b class='flag-5'>算</b>-<b class='flag-5'>体</b><b class='flag-5'>芯片</b>

    不同的一体有什么区别?

    SRAM是目前唯一一种跟先进CMOS工艺完全兼容且能大规模量产的存储介质,这也是支持大力的关键所在:从单独一体宏单元的角度,SRAM跟先进工艺的兼容性使其外围逻辑接口最能满足当前
    的头像 发表于 11-19 10:33 881次阅读
    不同的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>有什么区别?