0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

清华开发出超高性能计算芯片:速度比高端GPU提升3000倍,能效提升400万倍!

旺材芯片 来源:NATURE 2023-11-24 17:04 次阅读

随着各类大模型和深度神经网络涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代AI芯片,已成为国际前沿热点。中国科协发布的2023重大科学问题中“如何实现低能耗人工智能”被排在首位。

2023年10月25日,清华大学团队在超高性能计算芯片领域取得新突破。相关成果以“All-analog photo-electronic chip for high-speed vision tasks”为题发表在Nature上。这枚芯片基于纯模拟光电融合计算架构,在包括ImageNet等智能视觉任务实测中,相同准确率下,比现有高性能GPU算力提升3000倍,能效提升400万倍。

f09e5e20-7898-11ee-939d-92fbcf53809c.png

图1 相关论文(来源Nature)

未来已来?光为载体的计算芯片

实现算力飞跃并非易事,特别是当前传统的芯片架构,受限于电子晶体管大小逼近物理极限。全新计算架构成为破局的关键。光计算以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算。面对以光速计算的诱人前景,数年来海内外知名科研团队相继提出多种设计,但要替代现有电子器件实现系统级应用,仍面临重大瓶颈:一是如何在一枚芯片上集成大规模的计算单元(可控神经元),且约束误差累计程度;二是实现高速高效的片上非线性;三是为兼容目前以电子信号为主体的信息社会,如何提供光计算与电子信号计算的高效接口。当前常见的模数转换功耗,较光计算每步乘加运算高出多个数量级,掩盖了光计算本身的性能优势,导致光芯片难以在实际应用中体现出优越性。

系统级算力和能效,超现有芯片万倍

为解决这一国际难题,清华大学团队创造性地提出了模拟电融合模拟光的计算框架,构建可见光下的大规模多层衍射神经网络实现视觉特征提取,利用光电流直接进行基于基尔霍夫定律的纯模拟电子计算,两者集成在同一枚芯片框架内,完成了“传感前 传感中 近传感”的新型计算系统。极大地降低了对于高精度ADC的需求,消除传统计算机视觉处理范式在模数转换过程中速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模集成、高效非线性、高速光电接口三个关键瓶颈。

f0a20246-7898-11ee-939d-92fbcf53809c.png

图2. 光电计算芯片ACCEL的计算原理和芯片架构(来源Nature)

实测表现下,ACCEL芯片的系统级算力达到现有高性能芯片的数千倍。同时系统级能效达74.8 Peta-OPS/W,较现有的高性能GPU、TPU、光计算和模拟电计算架构,提升了两千到数百万倍。

在超低功耗下运行的ACCEL将有助于大幅度改善发热问题,对于芯片的未来设计带来全方位突破,并为超高速物理观测提供算力基础。同时对无人系统、自动驾驶等续航能力要求高的场景带来重大利好。

f0c45e36-7898-11ee-939d-92fbcf53809c.png

表1. ACCEL和现有高性能芯片的系统级实测性能指标对比 (来源:Nature)非相干光直接计算

更进一步,ACCEL芯片还支持非相干光视觉场景的直接计算,如论文中演示的交通场景实验。显著拓展了ACCEL的应用领域,有望颠覆目前自动驾驶、机器人视觉、移动设备等领域先将图片拍摄并保存在内存中后进行计算的思路,避免传输和ADC带宽限制,在传感过程中完成计算。

f0cdfc20-7898-11ee-939d-92fbcf53809c.gif

图3. ACCEL可用于电子设备超低功耗人脸唤醒示意动图(来源:清华大学)

开辟新路径:颠覆性架构有望真正落地

清华攻关团队提出的新型计算架构不仅对于光计算技术的应用部署意义重大,对未来其他高效能计算技术与当前电子信息系统的融合,亦深有启发。

论文通讯作者之一,清华大学戴琼海院士介绍道,“采用全新原理研发出计算系统是一座大山,而将新一代计算架构真正落地到现实生活,解决国计民生的重大需求,是攀过高峰后更重要的攻关。”Nature杂志特邀在Research Briefing发表的该研究专题评述也指出,“或许这项工作的出现,会让新一代计算架构,比预想中早得多地进入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.)”。

清华大学戴琼海院士、方璐副教授、乔飞副研究员、吴嘉敏助理教授为本文的共同通讯作者;博士生陈一彤、博士生麦麦提·那扎买提、许晗博士为共同一作;孟瑶博士、周天贶助理研究员、博士生李广普、范静涛研究员、魏琦副研究员共同参与了这项研究。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 晶体管
    +关注

    关注

    77

    文章

    9678

    浏览量

    138049
  • 人工智能
    +关注

    关注

    1791

    文章

    47137

    浏览量

    238113
  • 智能视觉
    +关注

    关注

    0

    文章

    100

    浏览量

    9205

原文标题:清华开发出超高性能计算芯片:速度比高端GPU提升3000倍,能效提升400万倍!

文章出处:【微信号:wc_ysj,微信公众号:旺材芯片】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    中国成功研发出世界首台拟态计算机 效能提升数百

    拟态计算机的最大特点是高效能。测试表明,针对特定运算任务的比可提升数十到数百。尽管拥有巨
    发表于 09-22 10:05 1310次阅读

    麻省理工新神经网络芯片速度增6 功耗少94%

    麻省理工学院(MIT)的研究人员开发出了一种可用于神经网络计算高性能芯片,该芯片的处理速度可达
    的头像 发表于 03-19 15:20 3656次阅读
    麻省理工新神经网络<b class='flag-5'>芯片</b><b class='flag-5'>速度</b>增6<b class='flag-5'>倍</b> 功耗少94%

     华为云MongoDB弹性伸缩能力提升100

    高性能并非一蹴而就,这与华为云深厚的技术积累息息相关。   10数据重构性能提升,得益于将数据复制功能卸载到分布式共享存储。分布式存储采用基于分区的并行复制方式;任意盘或节点故障
    发表于 08-03 13:00

    爱知制钢开发出比MR 灵敏度高100 万倍的微型地磁传感器

    爱知制钢开发出比MR 灵敏度高100 万倍的微型地磁传感器 丰田集团伞下的爱知制钢日前开发出了外形为4.6mm × 5.3mm × 0.8mm 的微型双轴地磁
    发表于 06-08 21:00 701次阅读

    麻省理工研发新神经网络芯片速度提升6,功耗减少94%!

    据MIT News报道,麻省理工学院(MIT)的研究人员开发出了一种可用于神经网络计算高性能芯片,该芯片的处理
    的头像 发表于 03-15 16:47 3462次阅读

    研究人员开发出半导体测量新技术,灵敏度比以往测量技术提升了10万倍!

    UT(德州大学,University of Texas)研究人员开发出一种半导体测量新技术,这项技术的灵敏度比以往测量技术提升了10万倍
    的头像 发表于 05-05 15:38 3143次阅读

    德州大学开发出半导体测量新技术 比以往提升10万倍

    UT(德州大学,University of Texas)研究人员开发出一种半导体测量新技术,这项技术的灵敏度比以往测量技术提升了10万倍。 UT电气与计算机工程专业的研究生Sukrit
    的头像 发表于 05-14 10:01 1447次阅读

    MIT设计新型光子芯片 效率比电子芯片高1000万倍

    MIT的研究人员开发出一种新型 “光子” 芯片,它使用光而不是电,并且在此过程中消耗相对较少的功率。该芯片用于处理大规模神经网络的效率比现有的计算机高出数百
    的头像 发表于 06-12 14:04 4143次阅读

    Imagination推出全新A系列GPU性能提升2.5

    Imagination公司发布了全新的A系列GPU,该系列分为AXE、AXM、AXT三款。据悉,全新的A系列GPU相较之前的GPU提升幅度巨大,其中的AXT
    的头像 发表于 12-03 14:29 3436次阅读

    AMD:用于AI训练及高性能计算将在2025年提高30

    高性能AMD EPYC(霄龙)处理器及AMD Instinct加速器致力于为人工智能训练和超级计算应用带来前所未有的提升 加利福尼亚州圣
    发表于 10-08 13:49 876次阅读

    清华大学团队在超高性能计算芯片领域取得新突破

    清华大学团队在超高性能计算芯片领域取得新突破,相关研究发表在Nature上。
    的头像 发表于 10-29 09:20 1022次阅读
    <b class='flag-5'>清华</b>大学团队在<b class='flag-5'>超高性能</b><b class='flag-5'>计算</b><b class='flag-5'>芯片</b>领域取得新突破

    清华大学开发出超高速光电计算芯片性能是商用芯片3000

    针对这一难题,清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出了一种“挣脱”摩尔定律的全新计算架构:光电模拟芯片,算力达到目前高性能商用
    的头像 发表于 10-31 18:00 1330次阅读
    <b class='flag-5'>清华</b>大学<b class='flag-5'>开发出超高</b>速光电<b class='flag-5'>计算</b><b class='flag-5'>芯片</b>,<b class='flag-5'>性能</b>是商用<b class='flag-5'>芯片</b>的<b class='flag-5'>3000</b><b class='flag-5'>倍</b>!

    中国开发芯片,算力提升3000

    据了解ACCEL芯片的光学芯片部分只要采用百纳米级别工艺,而电路部分更是可以采用180纳米CMOS工艺就能生产这种芯片,用如此落后的工艺却能将芯片
    的头像 发表于 11-03 16:29 790次阅读
    中国<b class='flag-5'>开发</b>新<b class='flag-5'>芯片</b>,算力<b class='flag-5'>提升</b><b class='flag-5'>3000</b><b class='flag-5'>倍</b>!

    国际首个全模拟光电智能计算芯片的算力可提升3000

    据团队介绍,实测结果显示,该芯片在智能视觉目标识别任务方面的算力可超过目前高性能商用芯片3000,为
    的头像 发表于 11-08 18:23 1470次阅读
    国际首个全模拟光电智能<b class='flag-5'>计算</b><b class='flag-5'>芯片</b>的算力可<b class='flag-5'>提升</b><b class='flag-5'>3000</b><b class='flag-5'>倍</b>

    AMD披露高效数据中心策略,预计至2027年提升超百

    会议期间,苏姿丰谈论了AMD如何通过实施30x25战略推动2025年计算节点提升30的目标。她进一步透露,AMD已找到2026年至20
    的头像 发表于 05-24 17:37 1010次阅读