0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

清华大学的存算一体化架构和并行加速方法专利

汽车玩家 来源:爱集微 作者:嘉德IPR 2020-03-14 11:41 次阅读

清华大学基于多个忆阻器阵列的全硬件完整存算一体系统,能够高效的运行卷积神经网络算法,证明了存算一体架构全硬件实现的可行性,对今后AI算力瓶颈的突破有着极大意义。

集微网消息,近日来,清华大学微电子学研究所、未来芯片技术高精尖创新中心的钱鹤、吴华强教授团队与合作者在《自然》在线发表了题为“Fully hardware-implemented memristor convolutional neural network”的研究论文,报道了基于忆阻器阵列芯片卷积网络的完整硬件实现。该成果所研发的基于多个忆阻器阵列的存算一体系统,在处理卷积神经网络时的能效远高于GPU,大幅提升了计算设备的算力,成功实现了以更小的功耗和更低的硬件成本完成复杂的计算。

随着以人工智能为代表的信息技术革命兴起,基于各种深度神经网络的算法可以实现图像识别与分割、物体探测以及完成对语音和文本的翻译、生成等处理。然而深度神经网络算法是一类以数据为中心的计算,实现该算法的硬件平台需要具有高性能、低功耗的处理能力,这就对集成电路芯片技术提出了的更高要求。目前传统实现该算法的硬件平台是基于存储和计算分离的冯诺依曼架构,这种架构在计算时需要将数据在存储器件和计算器件之间来回搬移,因此在包含大量参数的深度神经网络的计算过程中,该架构的能效较低。为此,开发一种新型计算硬件来运行深度神经网络算法成为当前亟需解决的问题。

基于这种情况,清华大学团队于2019年11月7日提出一项名为“基于忆阻器的神经网络的并行加速方法及处理器、装置”的发明专利(申请号:201911082236.3),申请人为清华大学。此专利针对复杂神经网络的运算,提供了一种基于忆阻器的存算一体化架构和并行加速方法,并在该系统架构上高效运行了卷积神经网络。

清华大学的存算一体化架构和并行加速方法专利

图1 忆阻器单元及阵列示意图

图一展示了忆阻器单元及阵列,是此专利所用的核心硬件结构。忆阻器是一种可以通过施加外部激励,调节其电导状态的非易失型器件。由忆阻器构成的阵列可以并行的完成乘累加计算,并同时进行计算和存储,因此基于这种特性可以对大量数据实现存算一体计算。由于乘累加是运行神经网络需要的核心计算任务。将忆阻器的的电导表示为权重值,可以实现高能效的神经网络运算,图1右侧展示的忆阻器阵列即为一个m行n列的神经网络权重矩阵。

清华大学的存算一体化架构和并行加速方法专利

图2 基于忆阻器阵列的卷积神经网络卷积计算与全连接计算示意图

卷积神经网络包括卷积层、下采样层、池化层和全连接层,每一层都需要做模块化的功能处理。在卷积层中,通过卷积核替代标量的权重,加上偏置量,并在每一层添加非线性激活函数,通过多个卷积层来解决较为复杂的问题。图2展示了基于忆阻器阵列的卷积计算和全连接计算示意图,用一个忆阻器阵列来实现一个卷积层的卷积计算,如对输入图像 “ 2”进行卷积处理,同时该卷积层包括多个卷积核,每个卷积核对应忆阻器阵列的一行,且每行的多个忆阻器分别用于表示一个卷积核的各个元素的值。而对于全连接型的计算,该忆阻器阵列的每一列用于接收全连接层的输入,各行用于提供全连接层的输出,每一行的多个忆阻器分别用于表示该行的输出对应的各个权重。

清华大学的存算一体化架构和并行加速方法专利

图3 基于忆阻器的神经网络并行加速示意图

基于忆阻器的神经网络并行加速示意图如图3所示,主要将多个第一忆阻器阵列并行地执行卷积层的操作,并将结果输出至第二功能层。通常卷积层需要多个子输入数据,可以按照任意顺序分别提供给多个第一忆阻器阵列,由于各子输入数据由忆阻器阵列进行卷积处理需要耗用的时间基本相同,因此加快卷积层的处理速度,即加快神经网络的处理速度,利用并行处理方式可以大大缩短处理时间。

清华大学的存算一体化架构和并行加速方法专利

图4 神经网络片外训练方法

图4展示了基于忆阻器阵列的神经网络片外训练方法,首先利用数学软件构建神经网络的数学模型,进而基于处理器和存储器等运行及训练上述数学模型,最后将训练好的数学模型的权重参数写入神经网络对应的忆阻器阵列,此时则可执行并行加速的计算过程,并同时对数据进行存储,实现存算一体加速。

随着计算存储一体化的发展趋势,基于忆阻器在硬件架构方面的革新,将数据存储单元和计算单元融合为一体,能显著减少数据搬运,极大提高计算并行度和能效。清华大学的钱鹤、吴华强教授团队搭建的这一基于多个忆阻器阵列的全硬件完整存算一体系统,并能够高效的运行卷积神经网络算法,并验证了图像识别功能,证明了存算一体架构全硬件实现的可行性,对今后AI算力瓶颈的突破有着极大意义。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4789

    浏览量

    101517
  • 忆阻器
    +关注

    关注

    8

    文章

    74

    浏览量

    20041
  • 存算一体
    +关注

    关注

    0

    文章

    105

    浏览量

    4404
收藏 人收藏

    相关推荐

    奇瑞汽车携手清华大学发布“分体式飞行汽车”专利

    继2024年10月在奇瑞全球创新大会上宣布三复合翼飞行汽车成功完成首航后,奇瑞再次带来飞行汽车领域的最新进展。日前,由奇瑞汽车股份有限公司与清华大学智能交通实验室共同申请的“分体式飞行汽车”专利正式公开,该
    的头像 发表于 02-20 09:14 206次阅读

    济南市中区一体化中心上线DeepSeek

    济南市中未来产业发展有限公司(简称“市中产发”)联合华为、北京昇腾和清昴智能基于市中区一体化中心(国家大学科技园节点)昇腾
    的头像 发表于 02-19 10:38 250次阅读

    清华大学与华为启动“卓越中心”专项合作

    近日,清华大学与华为技术有限公司在清华大学自强科技楼正式签署合作协议,共同宣布“清华大学鲲鹏昇腾科教创新卓越中心专项合作”(简称“卓越中心”)正式启动。 出席签约仪式的有清华大学副校长
    的头像 发表于 02-18 14:11 209次阅读

    文看懂5G通感一体化

    一体化是链接物理世界和数字世界的桥梁。 数多用:创造新价值 通感一体获取的数据,通过不同力建模,进行数据加工,提供给不同客户。 价值变现:引发商用模式变更 以基站为平台,构建通感
    的头像 发表于 01-16 17:53 597次阅读
    <b class='flag-5'>一</b>文看懂5G通感<b class='flag-5'>一体化</b>

    直播预约 |开源芯片系列讲座第24期:SRAM一体:赋能高能效RISC-V计算

    RISC-V计算报告简介一体种先进的计算架构技术,以克服传统冯诺依曼架构中计算单元与存储
    的头像 发表于 11-16 01:10 374次阅读
    直播预约 |开源芯片系列讲座第24期:SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>:赋能高能效RISC-V计算

    一体化与边缘计算:重新定义智能计算的未来

    随着数据量爆炸式增长和智能应用的普及,计算与存储的高效整合逐渐成为科技行业关注的重点。数据存储和处理需求的快速增长推动了对计算架构的重新设计,“
    的头像 发表于 11-12 01:05 429次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体化</b>与边缘计算:重新定义智能计算的未来

    一体架构创新助力国产大力AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《一体架构创新助力国产大
    的头像 发表于 10-23 14:48 498次阅读

    《嵌入式机电一体化系统设计与实现》读后感

    先给大家看看封面哦 再看居然还有签名呢 还贴心的送了书签哦,爱了爱了 在阅读了曾庆祥教授所著的《嵌入式机电一体化系统设计与实现》书后,我深感收获颇丰,对嵌入式系统与机电一体化系统的设计与实现有了
    发表于 08-21 08:45

    安消一体化平台建设方案

    与消防一体化平台已成为迫切需求。本文古河云科技将详细介绍针对企业安全生产和消防管理需求的一体化平台建设方案。 首先,安消一体化平台的系统架构应该包括前端展示层、后端数据处理层和数据存储
    的头像 发表于 07-26 14:14 531次阅读

    后摩智能推出边端大模型AI芯片M30,展现出一体架构优势

    了基于M30芯片的智模组(SoM)和力谋®️AI加速卡。   后摩智能一体架构芯片产品  
    的头像 发表于 07-03 00:58 4523次阅读

    探索内计算—基于 SRAM 的内计算与基于 MRAM 的一体的探究

    本文深入探讨了基于SRAM和MRAM的一体技术在计算领域的应用和发展。首先,介绍了基于SRAM的内逻辑计算技术,包括其原理、优势以及在神经网络领域的应用。其次,详细讨论了基于MR
    的头像 发表于 05-16 16:10 3414次阅读
    探索<b class='flag-5'>存</b>内计算—基于 SRAM 的<b class='flag-5'>存</b>内计算与基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>的探究

    科技携手北大共建一体化技术实验室,推动AI创新

    揭牌仪式结束后,王绍迪在北大集成电路学院举办的“未名·芯”论坛上做了主题演讲,分享了他对于多模态大模型时代内计算发展的见解。他强调了一体在人工智能领域的重要性及其未来发展趋势。
    的头像 发表于 05-08 17:25 1097次阅读

    北京大学-知科技一体联合实验室揭牌,开启知科技产学研融合战略新升级

    5月5日,“北京大学-知科技一体技术联合实验室”在北京大学微纳电子大厦正式揭牌,北京
    的头像 发表于 05-07 19:31 1609次阅读
    北京<b class='flag-5'>大学</b>-知<b class='flag-5'>存</b>科技<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>联合实验室揭牌,开启知<b class='flag-5'>存</b>科技产学研融合战略新升级

    聚焦全国一体化力体系构建,忆联以强大力“引擎”释放力潜能

    力是数字时代的生产力,为数字经济与实体经济深度融合提供了强大支持。在不久前结束的全国两会中,“全国一体化力体系”成为新词热词,会议提出“适度超前建设数字基础设施,加快形成全国一体化
    的头像 发表于 03-22 18:13 621次阅读
    聚焦全国<b class='flag-5'>一体化</b><b class='flag-5'>算</b>力体系构建,忆联以强大<b class='flag-5'>存</b>力“引擎”释放<b class='flag-5'>算</b>力潜能

    深圳市萨科微半导体有限公司,技术骨干来自清华大学和韩国延世大学...

    )从febless发展成为集设计研发、生产制造、销售服务一体化的国家级高新科技企业,“SLKOR”品牌在半导体行业声誉日隆,产业链的关键点已经实现了国产,萨科微乘电子元器件“国产替代”的东风,,立志
    发表于 03-15 11:22