0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存储器式运算将有助于新一代AI加速器发展

dKBf_eetop_1 来源:未知 作者:李倩 2018-05-04 16:06 次阅读

业界开始重新审视十年前开发的处理器架构,看好速度较GPU快1万倍的所谓「存储器式运算」(In-Memory Computing;IMC),将有助于新一代AI加速器发展。

新创公司、企业巨擘和学术界开始重新审视十年前开发的处理器架构,看好它或许刚好就是机器学习(machine learning)的理想选择。他们认为,「存储器式运算」(In-Memory Computing;IMC)架构可望推动新型的人工智能(AI)加速器进展,使其速度较现行的GPU更快1万倍。

这些处理器承诺可在CMOS微缩速度放缓之际扩展芯片性能,而要求密集乘法累积阵列的深度学习算法也正逐渐获得动能。这些芯片虽然距离商用化上市还有一年多的时间,但也可能成为推动新兴非挥发性存储器成长的引擎。

例如,新创公司Mythic瞄准在快闪存储器(flash)阵列内部进行神经网路运算任务,致力于从模拟领域降低功耗。该公司的目标是在2019年底量产芯片,成为率先推出这一类新芯片的公司之一。

美国圣母大学(Notre Dame)电子工程系系主任Suman Datta说:「在我们学术界大多数的人认为,新兴存储器将成为实现存储器处理器(processor-in-memory;PIM)的技术之一。采用新的非挥发性存储器将意味着创造新的使用模式,而存储器式运算架构将是关键之一。」

Datta指出,在1990年代,有几位学者试图打造这样的处理器。诸如EXECUBE、IRAM和FlexRAM之类的设计都「失败了,而今,随着相变存储器(PCM)、电阻式RAM (RRAM)和STT MRAM等新兴存储器出现,以及业界对于机器学习硬体加速器的兴趣浓厚,开始振兴这个领域的研究。不过,据我所知,大部份的展示都还是在元件或元件阵列层级进行,而不是一个完整的加速器。」

其中一家竞争对手来自IBM于2016年首次披露的「电阻处理器」(Resistive Processing Unit;RPU)。这是一款4,096 x 4,096交叉阵列的模拟元件。

IBM研究员Vijay Narayanan认为,「其挑战在于找出正确的模拟存储器元素是什么——我们正在评估相变、RRAM和铁电。」Vijay Narayanan同时也是一位材料科学家,他主要的研究领域是在高K金属闸极。

在2015年,美国史丹佛大学(Stanford University)也曾经发布在这一领域的研究。中国和韩国的研究人员也在追求这一理念。

为了实现成功,研究人员需要找到相容于CMOS晶圆厂的存储器元件所需材料。此外,Narayanan说,「真正的挑战」就在于必须在施加电压时展现对称的电导或电阻。

IBM Research的材料科学家Vijay Narayanan表示,大多数用于AI的存储器处理器仍处于研究阶段,距离可上市的时间约三至五年

关于未来电晶体的几点思考

IBM至今已经制造出一些离散式元件和阵列,但并不是一款具有4Kx4K阵列的完整测试芯片,也尚未采用目前所认为的理想材料。Narayanan表示,IBM的Geoff Burr在500 x 661阵列上采用相变材料进行深度神经网路(DNN)训练,而其结果显示「合理的精确度和加速度」。

「我们正稳步前进,但了解还必须改善现有的材料,而且也在评估新材料。」

IBM希望使用模拟元件,以便能够定义多个电导状态,从而较数位元件更有助于为低功耗操作开启大门。该公司还看好大型阵列可望成为平行执行多项AI操作的大好机会。

Narayanan乐观地认为,IBM可以利用其于高k金属闸极方面累积的多年经验,找到调整AI加速器电阻的材料。他花了十几年的时间,才将IBM在该领域的专业知识从研究转向商业产品,并与格芯(Globalfoundries)和三星(Samsung)等业界伙伴合作。

展望未来,IBM将致力于开发闸极全环(GAA)电晶体,将纳米片用于7nm节点以外的应用。他认为这一类的设计并不存在根本的障碍,而只是实施的问题。

除了纳米片之外,研究人员正在探索负电容场效电晶体(FET),这些FET可在电压变化很小的情况下提供较大的电流变化。从研究人员发现这种掺杂氧化铪是铁电材料,而且可能相容于CMOS后,过去这五年来,这种想法越来越受到关注。

但Narayanan也说,「目前还有很多反对者以及同时支持二者的人。」

「我们的研究显示,负电容是一种短暂的效应,」Notre Dame的Datta说,「因此,当极化开关切换时,通道电荷得以暂时启动,而一旦暂态稳定后就不会再取得任何结果。」

美国加州大学柏克莱分校(UC Berkeley)的研究人员则「相信这是一种重要的『新状态』。因此,故事仍在继续发展中,可以说大部份的公司都在内部进行评估中。 」

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1753

    浏览量

    74653
  • 存储器
    +关注

    关注

    38

    文章

    7470

    浏览量

    163699
  • 人工智能
    +关注

    关注

    1791

    文章

    47059

    浏览量

    238041

原文标题:人工智能重振存储器式运算架构

文章出处:【微信号:eetop-1,微信公众号:EETOP】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI驱动新型存储器技术,国内新兴存储企业进阶

    为了加速AI的训练与推理应用。但另方面,新型存储也在AI时代扮演越来越重要的角色,最近国内新兴存储
    发表于 10-16 08:10 909次阅读
    <b class='flag-5'>AI</b>驱动新型<b class='flag-5'>存储器</b>技术,国内新兴<b class='flag-5'>存储</b>企业进阶

    从版本控制到全流程支持:揭秘Helix Core如何成为您的创意加速器

    加速器
    龙智DevSecOps
    发布于 :2024年11月26日 13:42:47

    MSPM0-高级控制计时有助于实现更好的控制和更好的数字输出

    电子发烧友网站提供《MSPM0-高级控制计时有助于实现更好的控制和更好的数字输出.pdf》资料免费下载
    发表于 08-28 11:30 0次下载
    MSPM0-高级控制计时<b class='flag-5'>器</b><b class='flag-5'>有助于</b>实现更好的控制和更好的数字输出

    一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级AI中更快的嵌入处理

    电子发烧友网站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级
    发表于 08-15 11:06 0次下载
    下<b class='flag-5'>一代</b>高功能<b class='flag-5'>新一代</b><b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高级<b class='flag-5'>AI</b>系统高级<b class='flag-5'>AI</b>中更快的嵌入处理

    RISC-V在中国的发展机遇有哪些场景?

    的理想选择。 生态系统建设:多家头部芯片公司和生态厂商正在积极推进RISC-V在车规级产品的布局,这将有助于RISC-V在汽车领域的快速发展。 4. 数据中心和高性能计算(HPC) 性能与能效比
    发表于 07-29 17:14

    耐600℃高温存储器问世,有助于开发极端环境下的应用

    电子发烧友网(文/吴子鹏)近日,美国宾夕法尼亚大学科学家研制出款可在600℃高温下持续工作60小时的存储器。据悉,目前市场上主流的存储器耐温极限是200℃,旦超过了200℃便开始失
    的头像 发表于 05-07 01:15 2579次阅读
    耐600℃高温<b class='flag-5'>存储器</b>问世,<b class='flag-5'>有助于</b>开发极端环境下的应用

    Arm发布新一代Ethos-U AI加速器 Arm旨在瞄准国产CPU市场

    Arm发布的新一代Ethos-U AI加速器确实在业界引起了广泛关注。
    的头像 发表于 04-18 15:59 734次阅读

    Arm推动生成AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

    电子发烧友网报道(文/黄晶晶)在嵌入领域,边缘与端侧AI推理需求不断增长,Arm既有Helium 技术使 CPU 能够执行更多计算密集型的 AI 推理算法,也有Ethos 系列 AI
    的头像 发表于 04-16 09:10 4572次阅读
    Arm推动生成<b class='flag-5'>式</b><b class='flag-5'>AI</b>落地边缘!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>支持Transformer 架构,性能提升四倍

    在微芯片上使用3D反射堆栈有助于加快6G通信的发展

    项新的研究发现,在微芯片上使用3D反射堆栈可以使无线链路的数据速率提高三倍,从而有助于加快6G通信的发展
    的头像 发表于 03-13 16:31 668次阅读

    瑞萨发布下一代动态可重构人工智能处理加速器

    瑞萨最新发布的动态可重构人工智能处理(DRP-AI加速器,在业界引起了广泛关注。这款加速器拥有卓越的10 TOPS/W高功率效率,相比传统技术,效率提升了惊人的10倍。其独特之处在
    的头像 发表于 03-08 13:45 747次阅读

    NVIDIA将在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”

    根据各方信息和路线图,NVIDIA预计会在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”。
    的头像 发表于 03-04 09:33 1286次阅读
    NVIDIA将在今年第二季度发布Blackwell架构的<b class='flag-5'>新一代</b>GPU<b class='flag-5'>加速器</b>“B100”

    家居智能化,推动AI加速器发展

    提高了系统的运算能力和数据处理能力,还为用户带来了更加智能化、个性化的生活体验。   AI 加速器发展   在人工智能和机器学习任务变得日益复杂和密集之前,传统的CPU和GPU已经足
    的头像 发表于 02-23 00:18 4560次阅读

    回旋加速器原理 回旋加速器的影响因素

    回旋加速器(Cyclotron)是种用于加速带电粒子的可再生粒子加速器。它的工作原理基于带电粒子在恒定强磁场中的运动。本文将详细介绍回旋加速器
    的头像 发表于 01-30 10:02 3805次阅读

    种创新的面积和能效AI存储器设计—MCAIMem

    人工智能芯片通常使用 SRAM 存储器作为缓冲(buffers),其可靠性和速度有助于实现高性能。
    的头像 发表于 01-03 17:16 2226次阅读
    <b class='flag-5'>一</b>种创新的面积和能效<b class='flag-5'>AI</b><b class='flag-5'>存储器</b>设计—MCAIMem

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器种重要的实验设备,用于研究粒子物理学、核物理学等领域。其主要原理是通过电场和磁场的作用,对带电粒子进行
    的头像 发表于 12-18 13:52 2029次阅读