0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM开发“混合精度内存计算”,能耗降低了80倍

DPVg_AI_era 来源:未知 作者:胡薇 2018-04-27 17:42 次阅读

IBM Research 称,已经开发出了一种内存计算新方法,可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。

在近日 Nature Electronics 期刊上发表的一篇论文中,IBM 研究人员描述了这种新的 “混合精度内存计算” 方法。

IBM 关注传统计算体系结构的不同看法,在这种体系结构中,软件需要在单独的 CPURAM 单元之间进行数据传输。

据 IBM 称,这种被称为 “冯·诺依曼” 的体系结构设计,为数据分析和机器学习应用制造了一个瓶颈,这些应用需要在处理单元和内存单元之间进行更大的数据传输。传输数据也是一个耗能的过程。

应对这一挑战,IBM 给出的一种方法是模拟相变内存(PCM)芯片,该芯片目前还处于原型阶段,500 万个纳米级 PCM 器件组成 500×2000 交叉阵列。

PCM 的一个关键优势是可以处理大多数密集型数据处理,而无需将数据传输到 CPU 或 GPU,这样以更低的能量开销实现更快速的处理。

IBM 的 PCM 单元将作为 CPU 加速器,就像微软用于加速 Bing 和加强机器学习的 FPGA 芯片一样。

据 IBM 称,研究表明在某些情况下,其 PCM 芯片能够以模拟的方式进行操作,执行计算任务,并提供与 4 位 FPGA 存储器芯片相当的准确度,但能耗降低了 80 倍。

模拟 PCM 硬件并不适合高精度计算。所幸的是,数字型 CPU 和 GPU 是适合的,IBM 认为混合架构可以实现更高性能、更高效率和更高精度的平衡。

这种设计将大部分处理留给内存,然后将较轻的负载交给 CPU 进行一系列的精度修正。

根据 IBM 苏黎世实验室的电气工程师、也是该论文的主要作者 Manuel Le Gallo 称,这种设计有助于云中的认知计算,有助于释放对高性能计算机的访问。

Le Gallo 表示:“凭借我们现在的精确度,我们可以将能耗降低到是使用高精度 GPU 和 CPU 的 1/6。”

“所以我们的想法是,为了应对模拟计算中的不精确性,我们将其与标准处理器结合起来。我们要做的是将大量计算任务转移到 PCM 中,但同时得到最终的结果是精确的。”

这种技术更适合于如数字图像识别等应用,其中误解少数像素并不会妨碍整体识别,此外还有一些医疗应用。

“你可以用低精度完成大量计算——以模拟的方式,PCM 会非常节能——然后使用传统处理器来提高精度。”

对于只有 1 兆字节大小的 IBM 原型内存芯片,现在还处于初期阶段。为了适用于现代数据中心的规模化应用,它需要达到千兆字节的内存量级,分布在数万亿个 PCM 中。

尽管如此,IBM 认为可以通过构建更大规模的 PCM 设备或使其中 PCM 并行运行来实现这一目标。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1749

    浏览量

    74633
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10830

    浏览量

    211203
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4704

    浏览量

    128735

原文标题:IBM 取得内存计算新突破,AI 训练能耗降低 80 倍

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AMD Alveo V80计算加速器网络研讨会

    欢迎参加本次网络研讨会,我们将深入探讨 AMD Alveo V80 计算加速器如何帮助您处理高性能计算、数据分析、金融科技、网络安全、存储加速、AI 计算等领域的
    的头像 发表于 11-08 09:35 141次阅读

    是什么原因降低了INA116的输入阻抗?

    我的读数是100mV左右,那么用 商业的pH meter读到的数据是200左右。理论上出现这种情况是因为输入阻抗大概与玻璃电极相等,但是INA116的阻抗大概为10E15欧姆,而玻璃电极最大才10E9欧姆, 所以肯定是什么原因降低了我的INA116的输入阻抗。版主能否给我分析一下? 谢谢
    发表于 09-24 07:46

    浅析如何降低数据中心电力能耗

    ,如何减少数据中心的电力消耗成为了焦点问题。   1 IT设备能耗降低 数据中心的能耗主要源自IT设备。这些设备的直接能耗不仅增加了电费成本,而且还需要配备相应的电源和冷却系统,这些
    的头像 发表于 09-02 12:31 218次阅读
    浅析如何<b class='flag-5'>降低</b>数据中心电力<b class='flag-5'>能耗</b>

    IBM与日本AIST携手,共创量子计算新纪元

    在科技飞速发展的今天,量子计算已经成为全球科研领域的一大热点。据日经亚洲的最新报道,IBM即将与日本产业技术综合研究所(AIST)签署一份合作协议,共同研发规模高达10000量子比特的下一代量子计算机。这不仅标志着
    的头像 发表于 06-17 15:55 362次阅读

    浅析物联网环境下小麦加工过程能耗监测系统设计

    运行状态数据的自动采集与传输,并通过对数据的汇总与分析,为节能降耗提供基础数据。设计的系统在河南某面粉有限公司进行了示范应用,提高了企业能耗管理水平,降低了生产成本。 关键词: 小麦加工;能耗监测;物联网;生产执行
    的头像 发表于 06-05 10:08 834次阅读
    浅析物联网环境下小麦加工过程<b class='flag-5'>能耗</b>监测系统设计

    高性能计算集群的能耗优化

    、人工智能、大数据分析等。随着高性能计算集群的规模和性能的不断提升,其能耗问题也日益突出。高性能计算集群的能耗不仅增加了运行成本,还对环境造成了不利影响,例如温室气体排放
    的头像 发表于 05-25 08:27 387次阅读
    高性能<b class='flag-5'>计算</b>集群的<b class='flag-5'>能耗</b>优化

    借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

    对于大规模数据处理,最佳性能不仅取决于原始计算能力,还取决于高存储器带宽。 因此,全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计,这些应用需要
    发表于 05-16 14:09 201次阅读
    借助全新 AMD Alveo™ V<b class='flag-5'>80</b> <b class='flag-5'>计算</b>加速卡释放<b class='flag-5'>计算</b>能力

    AMD Alveo V80计算加速卡实现量产

    AMD公司近日迎来了一个重要的里程碑,其专为大型数据集和内存受限型应用设计的Alveo V80计算加速卡,已正式进入量产出货阶段。这款创新产品针对高性能计算(HPC)、数据分析、金融、
    的头像 发表于 05-16 11:40 582次阅读

    美光推出Crucial英睿达LPCAMM2内存模组,采用LPDDR5X技术,首家联发

    此款LPCAMM2内存采用了LPDDR5X技术,最高速度达到7500MT/s,远超DDR5 SO-DIMM的1.3,同时还能将待机功耗降低80%。与焊接式
    的头像 发表于 05-08 11:41 532次阅读

    IBM已同意收购HashiCorp 估值64亿美元

    的HashiCorp公司估值达64亿美元。 高达64亿美元交易金额是是IBM公司自2019年花费318亿美元收购软件公司RedHat以来最大的一笔收购。 IBM计划收购HashiCorp后创建一个专为人工智能时代设计的综合混合
    的头像 发表于 04-25 16:36 508次阅读

    用万用表测试发现电机UVW的电压只有12V左右,跟母线电压比降低了4,是否有办法提高?

    环境:FOC5.2.0 母线电压:48VDC 问题:用万用表测试发现电机UVW的电压只有12V左右,跟母线电压比降低了4,是否有办法提高?
    发表于 04-24 08:25

    出口韩国!IBM与韩国量子计算公司KQC展开新合作

    出口韩国!IBM与韩国量子计算公司KQC展开新合作
    的头像 发表于 02-19 12:50 360次阅读
    出口韩国!<b class='flag-5'>IBM</b>与韩国量子<b class='flag-5'>计算</b>公司KQC展开新合作

    如何降低三相异步电动机的能耗

    如何降低三相异步电动机的能耗降低三相异步电动机的能耗是一个重要的课题,可以通过多种方法来实现。在本文中,我们将详细介绍一些有效的措施来减少三相异步电动机的
    的头像 发表于 12-19 10:15 856次阅读

    IBM的新型模拟内存芯片能否证明AI操作的性能和能源效率呢?

    IBM 的新型模拟内存芯片证明了 AI 操作的性能和能源效率都是可能的。
    的头像 发表于 12-18 10:09 677次阅读

    请问AD7192噪声和精度是怎样计算的?

    请问AD7192噪声 和精度是怎样计算的?例如4.7HZ128时12NV有效值噪声怎么算出的精度22.5(20)
    发表于 12-06 08:03