0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据大爆炸?让人焦虑的内存计算怎么克服?

h1654155971.8456 来源:YXQ 2019-03-25 17:05 次阅读

在过去的几十年中,计算性能的提高是通过更快、更精确地处理更大数量的数据来实现的。

内存和存储空间现在是以千兆字节和兆字节来衡量的,而不是以千字节和兆字节。处理器操作64位而不是8位数据块。然而,半导体行业创造和收集高质量数据的能力比分析数据的能力增长得更快。

一方面,互联网和物联网正在推动数据爆炸。惠普实验室(Hewlett-Packard Labs)的研究科学家约翰·保罗·斯特拉坎(John Paul Strachan)在Leti设备研讨会(12月的IEEE电子设备会议的一个附带活动)上的一次演讲中指出,仅Facebook用户每天就产生4千兆字节(1千兆字节=1015字节)的数据。

通过传感器、摄像头和其他所有设备对现实的数字捕捉产生了更大的效果。一辆独立的汽车每天可以收集4 TB的数据,将来一个大城市可能会有数百万的数据。仅仅捕获这些信息并将其上传到中央数据中心所需的能量和带宽就很惊人。

神经网络和冯诺依曼瓶颈

同时,对大型数据集的大部分分析都属于神经网络。

神经网络的工作原理是计算矩阵的积和。将数据矩阵加载到数组中,并将每个元素乘以预定权重。在大多数情况下,结果将传递到网络的下一层并乘以一组新的权重。经过几个这样的步骤,就能得出关于数据是什么的结论。这有点像猫,可疑的行为模式,或者某种特殊的电活动。

在训练阶段,将网络的结论与先前已知的“正确”答案进行比较。然后,一个称为反向传播的过程使用预测值和正确值之间的差异向上或向下调整网络每个层中的每个权重。

从概念上讲,这种方法非常简单。但实际上,数据集很大,计算步骤也很大。ImageNet图像分类基准测试中表现最佳的是使用具有6000万个参数的8层神经网络。一次通过算法获得一个图像需要200亿次操作。

对于网络的每一层,现有权重和每个训练示例的元素都被加载到处理器的寄存器中,然后相乘,并将结果写回到存储器中。性能瓶颈不是计算,而是处理器和存储器阵列之间的带宽。存储器和处理器之间的这种分离是冯·诺依曼架构的定义特征之一,并且存在于几乎所有现代计算系统中。

大数据集,带宽受限的机器学习工作负载以及Dennard扩展的结束正在将行业基准从原始计算性能转变为计算效率。对于给定的任务,硅片面积,功耗和计算精度之间的最佳平衡是什么?

低精度,模拟内存,高精度

IBMResearchAlmaden的副总裁兼实验室主任JeffWelser在一次IEDM演示中指出,神经网络计算通常不需要高计算精度。16位计算模块使用等效32位块所需的四分之一电路空间,并将所需的数据量减半。即使使用传统架构,降低精度算法也可以显着提高计算效率。

克服内存瓶颈的需求也在推动更激进的计算内存架构。在这种体系结构的最简单视图中,预先确定的权重存储在非易失性内存元素数组中。将输入数据加载在内存字行上,并对来自单个单元格的电流求和。

究竟如何在硬件中实现这样的方案是正在进行的研究的主题。业界已经提出了数字和模拟解决方案。

例如,数字阵列可以由闪存元件组装而成。明尼苏达大学的研究人员展示了兼容CMOS的eflash存储单元,它将电荷存储在控制栅极和通道之间的浮动栅极上。在这样的阵列中,可以通过完善的集成电路设计精确地控制特定权重值和它们改变的速率(学习速率)。这种方法很有吸引力,因为它依赖于成熟,易于理解的组件技术。

然而,机器学习应用中感兴趣的许多数据本质上是模拟的。斯坦福大学和加州大学伯克利分校的研究员Xin Zheng及其同事观察到,通过使用固有存储模拟值的RRAM等存储元件,可以避免模数转换和数模转换及其相关的能耗和硅足迹。然而,目前可用的模拟存储器元件带来了一系列新的挑战。

当数字元件处于开启或关闭状态时,模拟元件可以具有一系列值。给定信号存储的值取决于设备的属性。在丝状RRAM中,电阻随着导电细丝在器件的端子之间形成而下降。一系列弱编程脉冲可能会产生弱细丝,而强脉冲会产生更强的细丝。因此,存储给定值所需的脉冲强度和数量取决于长丝形成的动力学。学习速率取决于电阻状态与从一个状态移动到下一个状态所需的脉冲数之间的分离。

对于推理任务,可以使用传统CMOS逻辑计算权重,然后将其存储在RRAM阵列中。使用给定数量的编程脉冲实现的精确值可能因设备而异,但模拟表明在面对这些变化时总体精度是稳健的。

然而,对于学习任务,随着修正在网络中的传播,个体权重需要上下调整。不幸的是,当前的RRAM设备通常具有对SET和RESET脉冲有不对称响应。简单地改变编程脉冲的符号不会在相反的方向上产生相等的调整。这种不对称性是学习任务在记忆中实现的一个主要问题。

耐力,稳定性和可重复性

如上所述,清华大学的研究生Meiran Zhao表示,学习任务还需要大量的数据和非常多的重量更新,大约10 5和10 7。针对传统存储应用设计的RRAM阵列的测试将设备寿命放在相同的范围内。然而,数据存储应用需要数字值——一个设备是开着的还是关着的——并且通常使用足够强的设置和重置脉冲来创建或移除一根强导电丝。如果使用弱脉冲代替,赵的小组表明模拟切换在超过10 11之后没有失败更新脉冲,尽管学习准确度确实降低到超过10 9个更新脉冲。

所需的大量训练周期也会威胁存储的重量值的稳定性。在RRAM装置中,灯丝的导电率由灯丝体积内的氧空位浓度决定。该浓度又由施加的电压脉冲控制。但是,不可能精确控制个别职位空缺的位置。当它们在器件内迁移时,无论是在电压梯度的影响下还是在热激发后,精确的电阻都会发生变化。

另一种非易失性存储器,即电化学RAM,试图解决丝状RRAM的局限性。当RRAM是双终端设备时,ECRAM是三终端设备。施加到第三端子的电压控制离子从LiPON电解质层插入到WO 3导体中。电阻取决于氧化还原反应,该反应可以在开启和关闭方向上精确且可重复地控制。

超越神经网络

卷积神经网络是最常见的机器学习技术,但它不一定是最好的。新兴存储器设备的非线性概率行为对于某些算法来说是一个挑战,但对其他算法来说可能是一个优势。

例如,生成对抗网络使用一个神经网络为另一个生成测试示例。当“鉴别器”网络能够区分真实数据和“发生器”网络生成的示例时,它就是成功的。

因此,鉴别器网络可以通过显示由发生器网络创建的一组非小狗图像来学习识别小狗的照片。生成对抗性网络算法的一个挑战是生成测试示例,这些测试示例涵盖了所有感兴趣的真实情况。“模式丢弃”,其中生成的示例聚集在有限数量的类别周围,可能会由于RRAM网络固有的随机性而减少。同样的非线性行为使得精确的权重难以存储,这可能导致更多的测试示例。

RRAM行为与历史有关。给定的重置脉冲实际重置设备的概率会随着之前设置的脉冲数的增加而降低。Imec的一个小组使用这种行为作为时间序列学习规则的基础 - 在时间t有效的装置用于预测在时间t +Δ处有效的装置。将该预测与实际数据进行比较,然后通过SET脉冲加强具有正确预测的设备,而通过RESET脉冲削弱具有不正确预测的设备。训练之后,将得到的网络拓扑用作生成新数据序列的模型。

最后,密歇根大学的研究人员将RRAM交叉开关阵列与随机导电桥存储器件结合使用,通过模拟退火来解决“自旋玻璃”优化问题。自旋玻璃问题源于物理学,但也适用于许多其他领域,它试图寻找相互作用自旋的随机二维阵列的最低能量状态。模拟退火随机翻转一组单个自旋,保留那些减少系统总能量的翻转,然后降低系统温度并重复该过程。密歇根集团利用CBRAMS的随机切换概率来降低找到局部最小状态而不是真正的最低能量状态的风险。

内存计算展望未来

从历史上看,电子设备研究首先出现,然后电气工程师和软件开发人员学会了如何利用新功能。

在过去的几年里,新兴的存储设备已经从实验室的奇思妙想,到令人失望的闪存替代品,再到新机器学习方法的推动者。

接下来的几年将展示半导体行业是否可以使用这些设备来帮助管理它正在帮助创建的数据大爆炸。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 内存计算
    +关注

    关注

    1

    文章

    15

    浏览量

    12143
  • 大数据
    +关注

    关注

    64

    文章

    8857

    浏览量

    137239

原文标题:数据大爆炸?让人焦虑的内存计算怎么克服?

文章出处:【微信号:eda365wx,微信公众号:EDA365电子论坛】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    海量数据处理需要多少RAM内存

    海量数据处理所需的RAM(随机存取存储器)内存量取决于多个因素,包括数据的具体规模、处理任务的复杂性、数据库管理系统的效率以及所使用软件的优化程度等。以下是对所需
    的头像 发表于 11-11 09:56 90次阅读

    内存模组n/a怎么解决?

    一、内存模组n/a问题概述 1.1 内存模组的定义 内存模组,又称为RAM(Random Access Memory),是计算机系统中用于存储数据
    的头像 发表于 10-14 10:44 270次阅读

    逻辑内存和物理内存的区别

    逻辑内存和物理内存计算机系统中两个重要的概念,它们在计算机的运行和数据处理中起着至关重要的作用。 1. 物理
    的头像 发表于 09-27 15:38 376次阅读

    计算机的内存容量有什么作用

    计算机的内存容量,作为一个核心概念,在计算机科学、信息技术以及日常使用中扮演着至关重要的角色。它不仅直接关系到计算机处理数据的能力,还影响着
    的头像 发表于 09-10 14:47 499次阅读

    内存缓冲区和内存的关系

    内存缓冲区和内存之间的关系是计算机体系结构中一个至关重要的方面,它们共同协作以提高数据处理的效率和系统的整体性能。
    的头像 发表于 09-10 14:38 382次阅读

    内存控制器概述和工作原理

    内存控制器是计算机系统内部控制内存并负责内存与CPU之间数据交换的重要组成部分。它不仅是连接CPU与内存
    的头像 发表于 09-04 14:19 450次阅读

    手机存储焦虑加剧,大内存手机引领消费者新风尚

    在当今数字化时代,智能手机已无缝融入人们的日常生活,成为不可或缺的核心工具。然而,随着手机功能的飞速扩展与应用程序的爆炸式增长,存储空间告急成为了普遍困扰用户的难题。据京东消费及产业发展研究院最新发
    的头像 发表于 08-20 16:29 469次阅读

    内存容量与类型如何影响计算机性能

    内存的容量与类型作为计算机硬件系统中的重要组成部分,对计算机的整体性能有着至关重要的影响。它们不仅决定了系统能够同时处理的数据量大小,还影响着程序的运行速度、系统的响应能力以及多任务处
    的头像 发表于 07-15 18:05 1818次阅读

    客户有哪些封装案例,一句克服使用PCBA工厂泪流满面

    的伤痛,会在某些时刻如潮水般涌来,她猝不及防。 饶萧萧说客户的一句克服使用,我泪流满面。 PCB 封装是什么 定义电子元器件和 PCB 之间的物理接口,为 PCB 组装生产和后期维修提供必要
    发表于 06-25 14:26

    客户有哪些封装案例,一句克服使用PCBA工厂泪流满面

    客户一句克服使用PCBA工厂泪流满面,今天我们一起来盘点盘点客户那些特殊的PCB设计和封装建立,你都是否有经历过,或者正准备这么做。
    的头像 发表于 06-25 14:20 271次阅读
    客户有哪些封装案例,一句<b class='flag-5'>克服</b>使用<b class='flag-5'>让</b>PCBA工厂泪流满面

    恒讯科技解析:通用型、内存型与计算型的云主机有什么区别?

    在云计算中,确实可以根据业务需求选择不同类型的云主机实例,正如选择适合特定旅行的车辆一样。以下是通用型、内存型和计算型云主机的一些特点和适用场景: 一、通用型云主机: 优势:提供均衡的CPU、
    的头像 发表于 06-05 17:29 417次阅读

    苏州旗芯微半导体专利:内存数据读取方法、系统及计算机设备

    此项申请主要涉及内存数据读取方法、系统及计算机设备。在其中一个实施案例里,内存能够在接到主机的读取指令后,从内存阵列中提取目标
    的头像 发表于 05-24 09:48 340次阅读
    苏州旗芯微半导体专利:<b class='flag-5'>内存</b><b class='flag-5'>数据</b>读取方法、系统及<b class='flag-5'>计算</b>机设备

    台积电美国一厂区发生爆炸

    台积电美国一厂区发生爆炸 据外媒报道,在美国当地时间的15日下午,台积电在亚利桑那州北凤凰城厂区出现爆炸事故,爆炸原因尚不清楚;但是爆炸事故至少造成1
    的头像 发表于 05-16 11:37 462次阅读

    系统内存和运行内存的区别

    的区别。 首先,系统内存是指计算机中存储程序和数据的硬件设备,也被称为主存或内存条。它是计算机用来临时存储
    的头像 发表于 01-15 16:32 3000次阅读

    LPDDR5X来袭!准备迎接内存速度大爆炸

    如今,智能、互联和带宽密集型应用依赖于超快、低延迟的内存访问,以实现我们日常生活所依赖的一系列功能。那么,什么样的技术能够满足这些要求?答案就是LPDDR5X SDRAM JEDEC标准,它是LPDDR5的可选扩展。
    的头像 发表于 12-18 17:19 2338次阅读
    LPDDR5X来袭!准备迎接<b class='flag-5'>内存</b>速度<b class='flag-5'>大爆炸</b>!