0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

聚焦 | 什么是AI芯片“存储墙”的解决方案?

SSDFans 来源:YXQ 2019-06-18 15:12 次阅读

在2016年威海参加中国体系结构年会的时候,孙所也说了一句调侃的话:“现在的AI很火,大家都往那边去,没有人太关心体系结构了,我要告诉那些追AI热点的,它都死了三回了!” 的确,作为从小学马列的中国人,我们最熟悉螺旋式上升的概念。对于计算和I/O来讲,和中国经济调控一样,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年发布了TPU V1之后,现在已经有越来越多的AI startup的芯片出现,大家基本上都是用标准的Resnet50,Googlenetv3 等网络为benchmark, 一次一次地刷新性能和功耗比,个人觉得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任务上超过人脑,现在AI在准确率和性能上都超过了。对于AI的芯片来讲,有一个指标也是大家讨论比较多的。Roofline model

Y轴是P,代表算力,用来FLOP/s来表示,现在新出的AI ASIC往往在FLOP/s并不发力,因为从功耗比的角度上,算力肯定不是越高越好,而且大家都很难高过老黄的核弹。

代表了一个特定的计算平台的peak performance,就是最大算力。

就是特定的计算平台的I内存/O带宽,这个和该计算平台使用的DDR类型有关。

X轴是I,代表计算强度,就是在一个Byte上的计算量。因为对于一个特定的平台,我可以知道它的最大算力和带宽,我们就可以知道它的最大的计算强度。

因此,和图上显示的一样,在点(Imax,),这个计算平台达到了完美。在它的左边,说明memory受限,在它的右边说明计算受限。

因此,对于我们之前分析的Alexnet这个网络,我们就知道了它的总的计算量就是:

内存访问量 计算量
Conv1 770235 105415200
Maxpool1 430368
Conv2 1057632 223948800
Maxpool2 273152
Conv3 1057792 149520384
Conv4 1521792 112140288
Conv5 1036160 74760192
Maxpool3 61696
FC1 37766144 37748736
FC2 16789504 16777216
FC3 4102096 4096000
SUM 65021158 724406816

因为对于每一次访存都是32位的Float Point,因此整个内存的占用就是 260MB左右,而计算量是724MFLOPs,因此Alexnet的计算强度就是724/260=2.7 operation/byte。

对于一个特定的平台,比如老黄家的新的GTX2080Ti 系列来讲:

对于计算性能,先不管老黄加各种Tensor Core,RTcore,从CUDA Core本身来讲,他是100TLOP/s,

它的内存带宽如下:

因此,作为2080Ti, 它的Imax就是166Operation/Byte.

可能到这个,就可以看出,对于Alex的2.7 来讲,远远没有达到2080ti的计算强度,主要是受限于内存带宽了。

在Google的TPU中,有一个图经常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上没有什么网络可以完全用满TPU的peak performance。

怎么办,内存带宽的解决方案就是HBM,HBM2, HBM3不断加大带宽。记得在2017年的CNCC上,谢源教授讲,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,证明了这条道路的正确性。他认为目前应该在AI芯片上摆脱这种”水多了加面,面多了加水“,in-memory 计算应该是下一个方向。

这个就引出了在Memory+会议上来自平头哥的段立德博士的topic,”Processing Near or In memory for deep learning".

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    458

    文章

    51526

    浏览量

    429480
  • AI
    AI
    +关注

    关注

    87

    文章

    32328

    浏览量

    271424

原文标题:什么是AI芯片“存储墙”的解决方案?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI时代的存储,哪种存算方案才能打破?

    回顾计算行业几十年的历史,芯片算力提升在几年前,还在遵循摩尔定律。可随着如今摩尔定律显著放缓,算力发展已经陷入瓶颈。而且祸不单行,陷入同样困境的还有存储。从新标准推进的角度来看,存储市场依然在朝
    的头像 发表于 04-21 01:36 3747次阅读
    <b class='flag-5'>AI</b>时代的<b class='flag-5'>存储</b><b class='flag-5'>墙</b>,哪种存算<b class='flag-5'>方案</b>才能打破?

    华为发布AI WAN解决方案

    在MWC25巴塞罗那期间,华为数据通信产品线总裁王雷在产品与解决方案发布会上正式发布了AI WAN解决方案。他表示,运营商加速网络与AI融合,AI
    的头像 发表于 03-05 10:18 207次阅读

    启明智显AI解决方案,用AI生活助手角度打开AI智能体的一天

    启明智显AI解决方案打造AI生活助手,用AI智能体的角度看AI解决方案能实现哪些功能
    的头像 发表于 02-26 14:43 229次阅读
    启明智显<b class='flag-5'>AI</b><b class='flag-5'>解决方案</b>,用<b class='flag-5'>AI</b>生活助手角度打开<b class='flag-5'>AI</b>智能体的一天

    广和通正式推出AI玩具大模型解决方案

    广和通近期推出了一款创新的AI玩具大模型解决方案,该方案深度融合了豆包等AI大模型,并内置了广和通Cat.1模组,为智能玩具的AI化升级提供
    的头像 发表于 01-24 10:36 657次阅读

    广和通发布AI玩具大模型解决方案

    近日,广和通推出了一项专为AI玩具设计的创新解决方案——AI玩具大模型解决方案。该方案深度融合了豆包等领先的
    的头像 发表于 01-21 14:45 679次阅读

    广和通推出AI玩具大模型解决方案

    广和通推出AI玩具大模型解决方案,该方案深度融合豆包等AI大模型、内置广和通Cat.1模组,助力智能玩具实现AI化升级。该
    的头像 发表于 01-21 10:27 335次阅读

    黑芝麻智能与RockAI发布AI Agent解决方案

    黑芝麻智能与RockAI联合发布基于武当C1200家族芯片AI Agent解决方案,该方案将部署于未来的智能座舱应用中。
    的头像 发表于 01-10 16:33 342次阅读

    企业AI解决方案包括哪些内容

    企业AI解决方案是一种集成了人工智能技术的综合性方案,旨在提高企业运营效率、降低成本、优化业务流程,并提升企业的整体竞争力。那么,企业AI解决方案
    的头像 发表于 01-10 10:15 166次阅读

    聚焦AI芯片,角逐芯未来

    国产AI芯片规模壮大 在科技高速发展的今天,算力已成为驱动行业创新与变革的核心引擎。中信证券发布的最新研报,聚焦于国产AI芯片市场的蓬勃发展
    的头像 发表于 01-08 09:10 307次阅读

    中兴通讯推出AI FWA全栈解决方案

    近日,在土耳其伊斯坦布尔举办的终端用户大会上,作为全球领先的综合信息与通信技术解决方案提供商中兴通讯,首次聚焦固定无线接入(FWA)与移动宽带(MBB)业务领域,并隆重推出了业界首创的AI FWA全
    的头像 发表于 11-18 17:10 890次阅读

    emc存储解决方案的优势

    在当今这个数据驱动的时代,企业对于数据存储的需求日益增长。EMC,作为全球领先的数据存储解决方案提供商,以其创新的技术、高性能的产品和全面的服务,帮助企业实现数据的高效管理和利用。 1. 高性能和可
    的头像 发表于 11-01 15:16 563次阅读

    忆联SSD存储解决方案亮相2024中国国际金融展

    数智化时代的存储解决方案”为主题发表演讲,分享忆联如何以高效能SSD存储解决方案助力AI时代下的金融科技产业实现存力飞跃。
    的头像 发表于 07-22 10:52 771次阅读
    忆联SSD<b class='flag-5'>存储</b><b class='flag-5'>解决方案</b>亮相2024中国国际金融展

    EVASH Ultra EEPROM:助力ChatGPT等AI应用的嵌入式存储解决方案

    EVASH Ultra EEPROM:助力ChatGPT等AI应用的嵌入式存储解决方案
    的头像 发表于 06-26 18:13 1012次阅读

    MK米客方德的AI智能存储解决方案

    随着人工智能(AI)技术的飞速发展,我们正步入一个前所未有的智能时代。AI不仅在改变着我们的生活方式,也在深刻影响着各行各业的发展。在众多领域中,存储行业作为数据的承载者,其重要性不言而喻。那么,
    的头像 发表于 05-27 10:04 560次阅读
    MK米客方德的<b class='flag-5'>AI</b>智能<b class='flag-5'>存储</b><b class='flag-5'>解决方案</b>

    risc-v多核芯片AI方面的应用

    应用中的成本。 最后,RISC-V多核芯片不仅可以应用于AI边缘计算领域,还可以扩展到其他领域,如数据中心、云计算、自动驾驶、机器人等,为这些领域提供高效、灵活和安全的解决方案。 总的来说,RISC-V
    发表于 04-28 09:20