IBM开发“混合精度内存计算”，能耗降低了80倍-电子发烧友网

IBM Research 称，已经开发出了一种内存计算新方法，可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。

在近日 Nature Electronics 期刊上发表的一篇论文中，IBM 研究人员描述了这种新的 “混合精度内存计算” 方法。

IBM 关注传统计算体系结构的不同看法，在这种体系结构中，软件需要在单独的 CPU 和 RAM 单元之间进行数据传输。

据 IBM 称，这种被称为 “冯·诺依曼” 的体系结构设计，为数据分析和机器学习应用制造了一个瓶颈，这些应用需要在处理单元和内存单元之间进行更大的数据传输。传输数据也是一个耗能的过程。

应对这一挑战，IBM 给出的一种方法是模拟相变内存（PCM）芯片，该芯片目前还处于原型阶段，500 万个纳米级 PCM 器件组成 500×2000 交叉阵列。

PCM 的一个关键优势是可以处理大多数密集型数据处理，而无需将数据传输到 CPU 或 GPU，这样以更低的能量开销实现更快速的处理。

IBM 的 PCM 单元将作为 CPU 加速器，就像微软用于加速 Bing 和加强机器学习的 FPGA 芯片一样。

据 IBM 称，研究表明在某些情况下，其 PCM 芯片能够以模拟的方式进行操作，执行计算任务，并提供与 4 位 FPGA 存储器芯片相当的准确度，但能耗降低了 80 倍。

模拟 PCM 硬件并不适合高精度计算。所幸的是，数字型 CPU 和 GPU 是适合的，IBM 认为混合架构可以实现更高性能、更高效率和更高精度的平衡。

这种设计将大部分处理留给内存，然后将较轻的负载交给 CPU 进行一系列的精度修正。

根据 IBM 苏黎世实验室的电气工程师、也是该论文的主要作者 Manuel Le Gallo 称，这种设计有助于云中的认知计算，有助于释放对高性能计算机的访问。

Le Gallo 表示：“凭借我们现在的精确度，我们可以将能耗降低到是使用高精度 GPU 和 CPU 的 1/6。”

“所以我们的想法是，为了应对模拟计算中的不精确性，我们将其与标准处理器结合起来。我们要做的是将大量计算任务转移到 PCM 中，但同时得到最终的结果是精确的。”

这种技术更适合于如数字图像识别等应用，其中误解少数像素并不会妨碍整体识别，此外还有一些医疗应用。

“你可以用低精度完成大量计算——以模拟的方式，PCM 会非常节能——然后使用传统处理器来提高精度。”

对于只有 1 兆字节大小的 IBM 原型内存芯片，现在还处于初期阶段。为了适用于现代数据中心的规模化应用，它需要达到千兆字节的内存量级，分布在数万亿个 PCM 中。

尽管如此，IBM 认为可以通过构建更大规模的 PCM 设备或使其中 PCM 并行运行来实现这一目标。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

IBM

IBM

+关注

关注
3

文章
1758

浏览量
74725
cpu

cpu

+关注

关注
68

文章
10873

浏览量
212054
gpu

gpu

+关注

关注
28

文章
4743

浏览量
129006

原文标题：IBM 取得内存计算新突破，AI 训练能耗降低 80 倍

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

为什么隔离ADC的采样频率可以如此显著的提高？但是带宽反而降低了？

。（AMC1304x-Q1）为什么隔离ADC的采样频率可以如此显著的提高？但是带宽反而降低了？为什么隔离ADC都是基于 Δ-Σ 调制器的，其他结构的（比如SAR）没有？

发表于 12-06 06:42

虚拟内存和云计算的关系

在现代计算机科学中，虚拟内存和云计算是两个关键的技术概念。虚拟内存是一种内存管理技术，它允许计算

发表于 12-04 09:50 •128次阅读

虚拟内存对计算机性能的影响

在现代计算机系统中，内存管理是确保系统高效运行的关键因素之一。虚拟内存技术作为内存管理的核心组成部分，对于提升计算机性能和用户体验起着至关重

发表于 12-04 09:17 •809次阅读

AMD Alveo V80计算加速器网络研讨会

欢迎参加本次网络研讨会，我们将深入探讨 AMD Alveo V80 计算加速器如何帮助您处理高性能计算、数据分析、金融科技、网络安全、存储加速、AI 计算等领域的

发表于 11-08 09:35 •210次阅读

是什么原因降低了INA116的输入阻抗？

我的读数是100mV左右,那么用商业的pH meter读到的数据是200左右。理论上出现这种情况是因为输入阻抗大概与玻璃电极相等，但是INA116的阻抗大概为10E15欧姆，而玻璃电极最大才10E9欧姆，所以肯定是什么原因降低了我的INA116的输入阻抗。版主能否给我分析一下？谢谢

发表于 09-24 07:46

浅析如何降低数据中心电力能耗

，如何减少数据中心的电力消耗成为了焦点问题。 1 IT设备能耗的降低数据中心的能耗主要源自IT设备。这些设备的直接能耗不仅增加了电费成本，而且还需要配备相应的电源和冷却系统，这些

发表于 09-02 12:31 •267次阅读

浅析如何<b class='flag-5'>降低</b>数据中心电力<b class='flag-5'>能耗</b>

IBM与日本AIST携手,共创量子计算新纪元

在科技飞速发展的今天，量子计算已经成为全球科研领域的一大热点。据日经亚洲的最新报道，IBM即将与日本产业技术综合研究所（AIST）签署一份合作协议，共同研发规模高达10000量子比特的下一代量子计算机。这不仅标志着

发表于 06-17 15:55 •391次阅读

浅析物联网环境下小麦加工过程能耗监测系统设计

运行状态数据的自动采集与传输,并通过对数据的汇总与分析，为节能降耗提供基础数据。设计的系统在河南某面粉有限公司进行了示范应用,提高了企业能耗管理水平，降低了生产成本。关键词: 小麦加工；能耗监测；物联网；生产执行

发表于 06-05 10:08 •892次阅读

浅析物联网环境下小麦加工过程<b class='flag-5'>能耗</b>监测系统设计

高性能计算集群的能耗优化

、人工智能、大数据分析等。随着高性能计算集群的规模和性能的不断提升，其能耗问题也日益突出。高性能计算集群的能耗不仅增加了运行成本，还对环境造成了不利影响，例如温室气体排放

发表于 05-25 08:27 •446次阅读

高性能<b class='flag-5'>计算</b>集群的<b class='flag-5'>能耗</b>优化

借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

对于大规模数据处理，最佳性能不仅取决于原始计算能力，还取决于高存储器带宽。因此，全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计，这些应用需要

发表于 05-16 14:09 •218次阅读

借助全新 AMD Alveo™ V<b class='flag-5'>80</b> <b class='flag-5'>计算</b>加速卡释放<b class='flag-5'>计算</b>能力

AMD Alveo V80计算加速卡实现量产

AMD公司近日迎来了一个重要的里程碑，其专为大型数据集和内存受限型应用设计的Alveo V80计算加速卡，已正式进入量产出货阶段。这款创新产品针对高性能计算（HPC）、数据分析、金融、

发表于 05-16 11:40 •620次阅读

美光推出Crucial英睿达LPCAMM2内存模组，采用LPDDR5X技术，首家联发

此款LPCAMM2内存采用了LPDDR5X技术，最高速度达到7500MT/s，远超DDR5 SO-DIMM的1.3倍，同时还能将待机功耗降低80％。与焊接式

发表于 05-08 11:41 •596次阅读

IBM已同意收购HashiCorp 估值64亿美元

的HashiCorp公司估值达64亿美元。高达64亿美元交易金额是是IBM公司自2019年花费318亿美元收购软件公司RedHat以来最大的一笔收购。 IBM计划收购HashiCorp后创建一个专为人工智能时代设计的综合混合云

发表于 04-25 16:36 •551次阅读

用万用表测试发现电机UVW的电压只有12V左右，跟母线电压比降低了4倍，是否有办法提高？

环境：FOC5.2.0 母线电压：48VDC 问题：用万用表测试发现电机UVW的电压只有12V左右，跟母线电压比降低了4倍，是否有办法提高？

发表于 04-24 08:25

出口韩国！IBM与韩国量子计算公司KQC展开新合作

出口韩国！IBM与韩国量子计算公司KQC展开新合作

发表于 02-19 12:50 •404次阅读

搜索历史

IBM开发“混合精度内存计算”，能耗降低了80倍

评论