0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三星基于HMB的存内计算芯片有何亮点?

我快闭嘴 来源:雷锋网 作者:雷锋网 2021-02-19 10:16 次阅读

存算一体或者叫存内计算技术随着AI的火热再一次成为业内关注的焦点,存储和计算的融合有望解决AI芯片内存墙的限制,当然,实现的方法也各不相同。雷锋网此前介绍过知存科技基于NOR FLASH存内计算,还有清华大学钱鹤、吴华强教授团队基于忆阻器的存算一体单芯片算力可能高达1POPs。三星基于HMB的存内计算芯片又有何亮点?

三星最新发布的基于HBM2的新型内存具有集成的AI处理器,该处理器可以实现高达1.2 TFLOPS的计算能力,从而使内存芯片能够处理通常需要CPUGPUASICFPGA的任务。

新型HBM-PIM(Processing-in-memory,存内计算)芯片将AI引擎引入每个存储库,从而将处理操作转移到HBM。新型的内存旨在减轻在内存和处理器之间搬运数据的负担,数据的搬运耗费的功耗远大于计算。

三星表示,将其应用于现有的HBM2 Aquabolt内存后,该技术可以提供2倍的系统性能,同时将能耗降低70%以上。该公司还声称,新存储器不需要对软件或硬件进行任何更改(包括对内存控制器),可以让早期采用者更快实现产品的上市。

三星表示,这种存储器已经在领先的AI解决方案提供商的AI加速器中进行了试验。三星预计所有验证工作都将在今年上半年完成,这标志着产品上市进入快车道。

三星在本周的国际固态电路会议(ISSCC)上展示了其新存储器架构的详细信息

如您在上面的幻灯片中看到的,每个存储库都有一个嵌入式编程计算单元(PCU),其运行频率为300 MHz,每个裸片上总共32个PCU。这些单元通过来自主机的常规存储命令进行控制,以启用DRAM中的处理功能,不同的是,它们可以执行FP16的计算。

该存储器还可以在标准模式下运行,这意味着新型的存储器既可以像普通HBM2一样运行,也可以在FIM模式下运行以进行存内数据处理。

自然地,在存储器中增加PCU单元会减少内存容量,每个配备PCU的内存芯片的容量(每个4Gb)是标准8Gb HBM2存储芯片容量的一半。为了解决该问题,三星将4个有PCU的4Gb裸片和4个没有PCU的8Gb裸片组合在一起,实现6GB堆栈(与之相比,普通HBM2有8GB堆栈)。

值得注意的是,上面的论文和幻灯片将这种技术称为功能内存DRAM(FIMDRAM,Function-In Memory DRAM),但这是该技术的内部代号,这个技术现在的名称是HBM-PIM。三星展示的是基于20nm原型芯片,该芯片在不增加功耗的情况下可实现每pin 2.4 Gbps的吞吐量。

论文将基础技术描述为功能内存DRAM(FIMDRAM),该功能在存储库中集成了16宽单指令多数据引擎,并利用存储库级并行性提供了比片外存储高4倍的处理带宽。另外,可以看到的是这种芯片存储解决方案无需对常规存储器控制器及其命令协议进行任何修改,这使得FIMDRAM可以更快在实际应用中使用。

不幸的是,至少在目前看来,我们不会在最新的游戏GPU中看到这些功能。三星指出,这种新内存要满足数据中心、HPC系统和支持AI的移动应用程序中的大规模处理需求。

与大多数存内计算技术一样,希望这项技术能够突破存储芯片散热的限制,尤其是考虑到HBM芯片通常部署在堆栈中,而这些堆栈并不都有利于散热。三星的演讲者没有分享HBM-PIM如何应对这些挑战。

三星电子存储器产品计划高级副总裁Kwangil Park表示:“我们开创性的HBM-PIM是业内首个针对各种AI驱动的工作负载(如HPC,训练和推理)量身定制的可编程PIM解决方案。我们计划通过与AI解决方案提供商进一步合作以开发更高级的PIM驱动的应用。”
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19485

    浏览量

    231510
  • 芯片
    +关注

    关注

    458

    文章

    51418

    浏览量

    428675
  • 三星电子
    +关注

    关注

    34

    文章

    15884

    浏览量

    181459
  • AI
    AI
    +关注

    关注

    87

    文章

    32012

    浏览量

    270869
收藏 人收藏

    相关推荐

    三星或受内存芯片价格下跌影响

    近日,信荣证券分析师Park Sang-wook对三星电子的未来前景表达了担忧。他预测,由于客户库存过剩,三星电子在2025年上半年可能会面临内存芯片价格下跌的挑战。 Park指出,尽管下半年
    的头像 发表于 11-27 11:22 445次阅读

    科技启动首届计算创新大赛

    计算作为一项打破“内存墙”“功耗墙”的颠覆性技术,消除了与算的界限,相比CPU或GPU能够实现更高计算并行度、更大专用算力,达成数量级
    的头像 发表于 11-21 10:44 345次阅读

    三星电容的封装形式哪些选择?

    三星电容提供多样化的封装形式,这些形式的选择主要取决于电容的类型、物理尺寸以及其在特定应用中的需求。为了满足不同场景下的使用要求,三星电容采用了多种封装技术。三星电容的封装形式多种选
    的头像 发表于 10-25 14:23 330次阅读

    三星或重获英伟达游戏芯片订单

    据外媒最新报道,三星电子有望重新获得英伟达的未来新款游戏芯片(GPU)制造订单,这一消息为三星的市场前景注入了新的活力。
    的头像 发表于 10-21 18:11 564次阅读

    三星贴片电容规格哪些呢?怎么选择呢?

    在这里可以明确的告诉大家,三星贴片电容的规格很多。目前有上百种电三星贴片电容的规格,因为不同的三星贴片的规格,所适用的电器是不一样的。那么三星
    的头像 发表于 05-24 16:31 433次阅读
    <b class='flag-5'>三星</b>贴片电容规格<b class='flag-5'>有</b>哪些呢?怎么选择呢?

    计算原理分类——数字计算与模拟计算

    数字计算与模拟计算各有优劣,都是算一体发展
    的头像 发表于 05-21 16:26 3013次阅读
    <b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>原理分类——数字<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>与模拟<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>

    三星手机屏维修技术人员

    想招三星手机屏维修人员,电子专业毕业,电子产品生产维修经验2年以上,有意向到美国工作的,欢迎留言私信!
    发表于 05-20 10:47

    计算——助力实现28nm等效7nm功效

    当的性能。算一体尝试通过集成存储和计算在一个芯片甚至一个容器,来突破访限制,发挥芯片的最大
    的头像 发表于 05-17 15:03 2196次阅读
    <b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>——助力实现28nm等效7nm功效

    浅谈计算生态环境搭建以及软件开发

    了对传统CPU的依赖,加快了整个数据分析过程。 ()环境搭建对软件开发的影响 搭建计算环境对软件开发的影响是深远的,尤其在提升软件的性能和效率方面。 首先,
    发表于 05-16 16:40

    计算WTM2101编译工具链 资料

    计算是突破物理极限的下一代算力技术- AIGC等人工智能新兴产业的快速发展离不开算力,算力的基础是人工智能芯片。 当前CPU/GPU在执行计算
    发表于 05-16 16:33

    探索计算—基于 SRAM 的计算与基于 MRAM 的算一体的探究

    本文深入探讨了基于SRAM和MRAM的算一体技术在计算领域的应用和发展。首先,介绍了基于SRAM的逻辑计算技术,包括其原理、优势以及在
    的头像 发表于 05-16 16:10 3317次阅读
    探索<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>—基于 SRAM 的<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>与基于 MRAM 的<b class='flag-5'>存</b>算一体的探究

    计算芯片研究进展及应用

    在NOR Flash计算芯片当中,向量-矩阵乘法运算基于电流/电压的跨导与基尔霍夫定律进行物理实现,如图7(a)所示。因此,其核心是设计NOR Flash单元阵列以满足大规模高能效
    的头像 发表于 05-16 15:30 1617次阅读
    <b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b><b class='flag-5'>芯片</b>研究进展及应用

    生态构建重要一环- 计算工具链

    本篇文章重点讲述计算相关工具链,我们将从工具链定义出发,依次讲述工具链研究背景及现有工具链、计算
    的头像 发表于 05-16 14:37 1290次阅读
    <b class='flag-5'>存</b><b class='flag-5'>内</b>生态构建重要一环- <b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>工具链

    计算技术工具链——量化篇

    本篇文章将重点讲述计算技术工具链之“量化”,我们将从面向计算
    的头像 发表于 05-16 12:35 1438次阅读
    <b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>技术工具链——量化篇

    三星设立半导体AGI计算实验室,推动AI芯片设计革新

    三星电子半导体业务近日取得重大进展,其CEO庆桂显在社交媒体平台上宣布,公司在美国和韩国正式成立半导体AGI(通用人工智能)计算实验室,并已经开始进行人才招聘工作。这一实验室的成立,标志着三星在人工智能
    的头像 发表于 03-20 10:13 720次阅读