0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存算一体化芯片简史介绍 在DRAM上的各种尝试

SSDFans 2019-07-04 16:02 次阅读

之前的几篇基本都是在讲,复兴的深度学习技术让内存和计算单元之间的GAP变得更大了,这个问题已经从传统的Memory Wall的讨论打了PIM的时代。说道PIM, Porcessor in Memory, 笔者在2014年的时候参加过一个Intel的高逼格的会议,当时3DXP已经在开发,Intel的同学讲,未来的CPU会坐在一个巨大的内存结构上,当时刚刚普及的NAND Flash技术只是个临时方案。因为NAND Flash和CPU之间的连接总是有一种,茶壶倒饺子的感觉。2014年的时候,深度学习应该是刚刚开始,大家都在纠结如何把数据从CPU传递到GPU,(其实,现在大家还在纠结)。

之后,借着大数据和深度学习的东风,PIM一下子流行起来。其实,PIM并不是一个新概念, 每一个很靠谱的PIM的综述文章都会讲那个开始-The Berkeley IRAM Project。

和他的亲兄弟RISC-V不一样,IRAM的命运不济,没有走到工业化这条路上。对于这个项目,David Patterson 大神在他的《Microprocessors in 2020》都讲过这个。大神就是大神,如果你现在看看这篇文章,会发现这个世界上的预言并不总像《沪市一万点不是梦》一样不靠谱。

文章的内容总结如下:

  1. 晶体管的集成度是惊人的,他们之前在1980年的预测过于保守,按那时的预测,在1995年,他们已经用上了2000年的电脑

  2. 冯氏体系的优点是比较适合通用计算,但是未来更需要SIMD和并行的支持。

  3. 从1995年来看,2020年的电脑并不会有多大的不同。

  4. 最后,他安利了IRAM这个项目,认为计算和存储的结合会带来架构上的收益.

存算一体化芯片简史介绍 在DRAM上的各种尝试

一句话,IRAM并没有像大神的RISC和RAID一样被工业届买单,但是Intel目前对于DeepLearning的看家吃法的家伙AVX-512就是加专用向量处理器的例子。【1】

另一个比较有代表意义的就是寒武纪的大电脑了。上一节的IRAM只是加了一个向量处理器在哪里,当时主要的想法是做并行计算,但是一直到现在,并行计算依然对于广大的程序猿来讲还是比较困难的。在IRAM的指令集的角度上,对比了标量和向量实现并行的对比。

存算一体化芯片简史介绍 在DRAM上的各种尝试

看到这个,做芯片的同学是不是想到了SPARC,"While slower then recent Intel offerings, architecturally UltraSparc remains a very interesting microprocessor with unique (and very compiler friendly) organization of registers. And as we mentioned before it is a big Endean microprocessor, which is actually the only right way to build microprocessors :-)."[2]

因此,DaDianNao的创新就在从计算机体系结构的角度,把一个NFU和内存结合。如何说IRAM是一个通用方案的话,Dadiannao就是一个专用的方案了。要知道,在2014年,大部分用户还在忙着调整GPGPU的参数,而DaDiannao类似于一个AI加速器的开山祖师,创建了RAM+NFU的流派。

存算一体化芯片简史介绍 在DRAM上的各种尝试

SSDFans的同学们都知道,早在1985年,Toshiba就发明了NAND Flash,最近几年NAND Flash的大事就是盖楼,从平面到了立体,本来大家在15nm(1Y)之后,还要接着想办法挖沟。用了3D技术之后,一下子回到了40nm的幸福时光,每家都在大干快上,最高记录目前是512层。[3]

其实,DRAM也在搞同样的事情,和NAND Flash不同,NAND Flash是摩天大楼,而DRAM则是6层的板楼。

存算一体化芯片简史介绍 在DRAM上的各种尝试

对的,HMC和HBM所用的Memory还是普通的DRAM芯片,只是用新的芯片封装工艺和计算芯片集成。HBM的使用和DRAM的使用并没有大的区别。这个和最新AMD的ZEN2 Rome的CPU类似,7nm的计算die和14nm的IOdie合封。目前在hyerpscale,特别是OCP里面,一个chiplet的概念特别流行chiplet[4]. 这里不得不说一下我的老东家Avago就特立独行。人家整了一个比V100还大的独立片子[5],21,000,000,000的晶体管,7nm一句话,俺能卖出去,管什么良率问题。

因此,很自然,通过牛逼的工艺,把memory和计算单元合体,大家都在做,包括笔者供职的Xilinx也在搞AICore和HBM。现在的AI芯片,如果没有HBM的配置,估计都不好意思出门了。

不知道为什么,段教授选了一个这个例子。

存算一体化芯片简史介绍 在DRAM上的各种尝试

如果有懂行的同学可以评论一下。好了,这个段落主要是将讲了在DRAM上的各种尝试,2D和3D都有,但是基本上memory和xPU之间的界限还是明显的,虽然在一张床上,还是没有水乳交融。比较关心业界动态的,这一节基本上是靠谱的技术,都可以实现的。下一节应该都是脑洞了。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DRAM
    +关注

    关注

    40

    文章

    2305

    浏览量

    183363
  • 深度学习
    +关注

    关注

    73

    文章

    5495

    浏览量

    121044
  • RISC-V
    +关注

    关注

    44

    文章

    2237

    浏览量

    46074
  • 存算一体
    +关注

    关注

    0

    文章

    100

    浏览量

    4289

原文标题:存算一体化芯片简史

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一体力AI芯片将逐渐走向落地应用

    电子发烧友网报道(文/李弯弯)前不久,后摩智能宣布,其自主研发的业内首款一体力AI芯片成功点亮,并成功跑通智能驾驶算法模型。   这
    的头像 发表于 05-31 00:03 4953次阅读

    一体更进步,“感一体化”前景如何?

    一体芯片是为了打破冯诺依曼存储计算分离的计算架构所造成的“内存墙”的系统限制,而“感一体化
    的头像 发表于 06-08 00:01 5347次阅读

    一体技术路线如何选

    ,或是直接进行大一体芯片的研究,有的是采用模拟的
    的头像 发表于 06-21 09:27 4245次阅读

    一体技术发展现状和未来趋势

    一体
    电子发烧友网官方
    发布于 :2023年04月25日 17:21:41

    什么是机电一体化

    产品的例子。装有微型计算机的电视机和电饭煲等因为其工作原理载本质是无运动的,所以补属于机电一体化产品。5) 控制工程学控制工程学及控制技术于机电一体化技术的目标使致的,机电
    发表于 08-29 09:06

    机电一体化系统

    容易由上诉5个要素与人体相对应。对于其它的机电一体化系统,如微机控制型缝纫机、自动变焦照相机、自动变焦防颤型摄像机等,只要存在机械运动就必然也包含着5个要素。 3.机电一体化系统的组成机电
    发表于 08-29 09:11

    如何实现机电一体化设计?

    用户总是要求我们提高所设计的机械的性能,同时减少资金成本。为了达到这两个矛盾的目标,我们将注意力放到机械设计方面有巨大潜力的机电一体化。本文着重展示了使用嵌入式分析工具的现代计算机辅助设计(CAD)系统,告诉大家,如何才能实
    发表于 08-07 06:48

    机电一体化综合实训考核

    各种控制和工程实践能力。ZN-01MES机电一体化综合实训考核装置由五个单元组成,分别为:料检测单元、搬运
    发表于 07-02 07:36

    或让功耗降低1000倍,一体芯片正在突破

    电子发烧友网报道(文/李弯弯)为什么一体化越来越受到关注?今年1月,阿里达摩院发布的2020十大科技趋势中,其中个是,计算存储
    的头像 发表于 12-22 08:29 5883次阅读

    基于RISC-V开放架构的一体化芯片解决方案

    RISC-V优势多多,RISC-V可以同时满足三种的需求并且具有友好的软件开发环境。本文主要介绍了由英韧科技的ceo介绍的基于RISC-V开放架构的
    的头像 发表于 06-23 09:50 2575次阅读
    基于RISC-V开放架构的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体化</b><b class='flag-5'>芯片</b>解决方案

    亿铸科技发布基于ReRAM的全数字一体AI大芯片技术

    刚刚结束的GTIC 2022全球AI芯片峰会存一体专题论坛,亿铸科技创始人、董事长兼CEO熊大鹏博士发表了题为“
    的头像 发表于 09-01 11:50 2614次阅读

    一体芯片新突破!清华大学研制出首颗一体芯片

    集成电路学院教授吴华强副教授高滨团队基于一体计算范式研制出的全球首颗全系统集成支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器
    的头像 发表于 10-11 14:39 1091次阅读

    什么是一体芯片一体芯片的优势和应用领域

    一体片上学习实现更低延迟和更小能耗的同时,能够有效保护用户隐私和数据。该芯片参照仿生类脑处理方式,可实现不同任务的快速“片
    的头像 发表于 10-23 14:15 5145次阅读
    什么是<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>芯片</b>?<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>芯片</b>的优势和应用领域

    什么是通感一体化?通感一体化的应用场景

    通感一体化可广泛应用于智能家居、智慧城市、智慧交通、医疗健康等方面。文档君为大家搜集了些典型的应用场景。 智能家居 通感一体化利用基站
    发表于 01-18 16:12 1.1w次阅读
    什么是通感<b class='flag-5'>算</b><b class='flag-5'>一体化</b>?通感<b class='flag-5'>算</b><b class='flag-5'>一体化</b>的应用场景

    一体化与边缘计算:重新定义智能计算的未来

    、人工智能(AI)等技术的发展,数据量的分布性、实时性需求增加,边缘计算也逐渐从概念走向落地。本文将介绍一体化与边缘计算的核心思想及其发展趋势,探讨两者
    的头像 发表于 11-12 01:05 170次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体化</b>与边缘计算:重新定义智能计算的未来