0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达详细介绍了一种微型测试芯片,可以独立完成底层工作

DPVg_AI_era 来源:lq 2019-07-13 07:44 次阅读

英伟达详细介绍了一种微型测试芯片,可以独立完成底层工作;但当36个芯片团结起来时,性能可以提升32倍。与使用相同精度的先前原型相比,单个芯片的面积效率至少为16倍,能量效率为1.7倍。

如何确保在大型和小型任务之间切换,而不至于牺牲效率呢?显然把单个的、实验性的加速器芯片,变成可以随意组合的模块化形式,是一个具备可行性的解决方案,这也是英伟达在做的事情。

作为GPU动力工厂,英伟达当然希望能够为各种规模的AI任务提供解决方案:从大规模的数据中心任务、到始终在线的低功耗神经网络(这些网络需要监听语音助理接收到的唤醒词)。

这不是个简单的任务,通常来说需要将几种不同的技术混合使用。可是,这样的方式显然不如只部署一种好。

英伟达一直在寻求“one ring to rule them all”的解决方案:是否可以构建一些可扩展的模块化产品,同时在整个环节中又不过多浪费每个瓦特的效率呢?其首席科学家Bill Dally说,英伟达最终找出了答案。答案是肯定的。

上个月举行的VLSI研讨会上,英伟达详细介绍了一款小巧的测试芯片,它可以独立完成底层的工作,也可以在一个模块中与多达36个同类型芯片紧密联系,进行深度学习一类的重任务,而且每个芯片都实现了大致相同的顶级性能。

单个加速器芯片更多的是被设计成为深度学习的执行方,而不是训练方。工程师测量这种“推理”芯片的性能的方式,通常是根据每焦耳能量或毫米面积可以进行多少次操作。

英伟达原型芯片中,一个峰值可达到每秒4.01 Tera次操作(相当于每秒10000亿次)和每毫米1.29 TOPS。

和其他组中使用相同精度的先前原型比,该单芯片的面积效率至少是这些原型的16倍,能量效率至少达到1.7倍。

而当36个芯片连接成为一个芯片系统后,它达到了127.8 TOPS,相当于性能提升了32倍!

通过这项研究,英伟达试图证明,只用一种技术应对所有场景是可能的、也是可行的。或者,起码当这些芯片和多芯片模块中英伟达的网状网络连接在一起的时候,可以做得到。

这些模块基本上是小型印刷电路板或硅片,它们也可以作为一个大型IC处理多个芯片。这种形式正变得越来越流行,因为可以将几个较小芯片随意组成系统(通常称为小芯片,相对单一的更大、更昂贵的大芯片而言)。下图是多芯片模块的图例:

Dally解释道:“多芯片模块的形式具有很多优势。不仅适用于未来可扩展的(深度学习)加速器,还适用于构建具有不同功能的加速器的产品版本。”

英伟达多芯片模块之所以能够将新的深度学习芯片绑定在一起,关键是一个使用了称为“ground-referenced信号”技术的芯片间网络。

顾名思义,GRS使用导线上的电压信号和common ground之间的差来传输数据,同时避免了该方法的许多已知缺陷。

它可以使用单根线传输25GB/秒的数据,而大多数技术需要一对电线才能达到同样的速度。使用单线可以提高每秒毫米边缘流量的数据量,达到每秒高达几TB的数据量。更重要的是,GRS的功耗仅为每比特几皮焦。

不止如此,Dally还表示,他们已经完成了一个版本,使得该芯片的TOPS/W实现了翻倍。而他的团队也在不断推动新的加速技术,希望达到200 TOP/W的同时,仍然保持可扩展性。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    456

    文章

    50987

    浏览量

    425178
  • 英伟达
    +关注

    关注

    22

    文章

    3805

    浏览量

    91422
  • 深度学习
    +关注

    关注

    73

    文章

    5508

    浏览量

    121320
收藏 人收藏

    评论

    相关推荐

    英伟加速认证三星AI内存芯片

    近日,英伟公司正在积极推进对三星AI内存芯片的认证工作。据英伟CEO透露,他们正在不遗余力地
    的头像 发表于 11-25 14:34 276次阅读

    英伟Blackwell芯片量产加速,Q4预计出货45万片

    摩根士丹利最新发布的报告揭示英伟在AI芯片领域的重大进展,其最新力作Blackwell芯片已成功步入量产阶段,预示着
    的头像 发表于 09-27 15:02 892次阅读

    亚马逊AWS自研AI芯片崛起,挑战英伟

    近期,据路透社独家报道披露,在德克萨斯州奥斯汀市处紧密防守的芯片实验室中,六位来自亚马逊AWS的工程师正在对一种尚未公开透露名称及详细参数的新型服务器展开深入
    的头像 发表于 07-27 14:33 1136次阅读

    英伟带领芯片股飙升 英伟大涨4.76%

    英伟不愧是总龙头,大涨4.76%。英伟带领芯片股飙升;甚至可以说是带动了美国股市上涨,在当地
    的头像 发表于 07-23 16:26 346次阅读

    三星电子否认HBM3e芯片通过英伟测试

    韩国新闻源NewDaily近日发布则报道,声称三星电子的HBM3e芯片已成功通过英伟的产品测试
    的头像 发表于 07-05 16:09 620次阅读

    AI芯片霸主英伟在其总部建了张5G专网

    近日,美国联邦通讯委员会(FCC)批准芯片巨头英伟在其加利福尼亚州的总部建立个私有、独立部属(SA)的5G无线网络,搭建了这
    的头像 发表于 06-05 08:05 155次阅读
    AI<b class='flag-5'>芯片</b>霸主<b class='flag-5'>英伟</b><b class='flag-5'>达</b>在其总部建了<b class='flag-5'>一</b>张5G专网

    三星HBM芯片遇阻英伟测试

    近日,三星电子最新的高带宽内存(HBM)芯片英伟测试中遭遇挫折。据知情人士透露,芯片因发热和功耗问题未能达标,影响到了其HBM3及下
    的头像 发表于 05-24 14:10 542次阅读

    步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    2024年3月19日,[英伟]CEO[黄仁勋]在GTC大会上公布代AI芯片架构BLACKWELL,并推出基于该架构的超级
    发表于 05-13 17:16

    Meta将率先使用英伟最新人工智能芯片

    近日,Meta向外媒透露,他们预计将在今年晚些时候收到英伟最新旗舰人工智能芯片的首批出货,这也标志着英伟正式开启
    的头像 发表于 03-22 10:16 582次阅读

    英伟最新代AI芯片Blackwell GPU,AI算力能力较上代提升30倍!

    黄仁勋说:"我们已经来到了个临界点,因此需要一种新的计算方式来加速整个行业的发展效率。那么英伟能够做什么?当然,答案就是——更大的芯片
    的头像 发表于 03-19 13:39 1939次阅读

    英伟公布其新的6G研究云平台

    3月19日消息,在年度GTC AI活动中,英伟公布其新的6G研究云平台,5G公众号了解到这是一种“三管齐下”的方法,致力于让英伟
    的头像 发表于 03-19 11:04 1037次阅读

    英伟为什么越涨越便宜?英伟的市盈率直在下降?

    英伟为什么越涨越便宜?英伟的市盈率直在下降? 在2023年英伟
    的头像 发表于 03-12 18:02 1845次阅读

    英伟要小心!爆火的Groq芯片能翻盘吗?AI推理速度「吊打」英伟

    随着科技的飞速发展,人工智能公司Groq挑战了英伟的王者地位,其AI芯片不仅展现出卓越的实力,还拥有巨大的潜力。Groq设计一种独特的推
    的头像 发表于 03-08 09:44 949次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>要小心<b class='flag-5'>了</b>!爆火的Groq<b class='flag-5'>芯片</b>能翻盘吗?AI推理速度「吊打」<b class='flag-5'>英伟</b><b class='flag-5'>达</b>?

    国内谁可以取代英伟

    国内有些公司在某些领域已经或正在尝试替代英伟,特别是在AI芯片和图形处理器领域。
    的头像 发表于 03-01 16:59 8677次阅读