0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Lightmatter公司推出用于通用AI加速的光子计算测试芯片

我快闭嘴 来源:芯东西 作者:芯东西 2020-09-02 17:25 次阅读

AI芯片的下一个创新点在哪儿?光子计算或许能提供新的启发。8月31日报道,在刚落幕不久的Hot Chips 32大会上,脱胎于麻省理工学院的初创公司Lightmatter展示了用于通用AI加速的光子计算测试芯片。该处理器利用硅光子和MEMS技术,以光速处理矩阵向量乘法,由毫瓦级激光光源供电。据悉,在相同芯片面积上,光子器件的速度比电子器件快1000倍,而功耗仅有电子器件的1/1000。

Lightmatter于2017年在马萨诸塞州波士顿市成立,目前有46名员工,已从Google Ventures等投资方处融资3300万美元,拥有30项专利。

作为最早面向AI推理定制光子芯片的公司之一,Lightmatter将于2021年秋季推出其首款商业产品——搭载光子计算芯片的PCIe卡,专为数据中心AI推理工作负载而设计。

一、能效提升20倍,吞吐量提高5倍

得益于硅光子技术的进步,硅芯片上的光传输成为可能。

光子芯片通过采用与传统基于晶体管的电子器件完全不同的物理学原理,可实现更快的性能、更低的能耗。

Lightmatter首席执行官尼克·哈里斯称:“我们可以利用现有AI数据中心,将能耗降低为原来的1/20,将物理空间减少为原来的1/5。”

据他介绍,这只是Lightmatter正在打造的第一代产品,未来还有很长的路线图。

哈里斯强调,此次展示的测试芯片只是作为其技术的演示,并不是为了在基准测试中有出色表现。

但他坚持认为,在实际应用中,该演示芯片仍将击败AI加速领域的市场领导者——英伟达A100 GPU

据哈里斯介绍,与A100相比,其光子芯片在BERT和ResNet-50推理等工作负载上可提供20倍的能效和至少5倍的吞吐量。

二、格芯代工,采用3D封装堆叠

Lightmatter的芯片由两个垂直堆叠的芯片组成,整个芯片面积为150平方毫米,两个裸片均由格芯标准CMOS工艺制造,包含超过十亿个FinFET晶体管、数万个光子算术单元和数百个记录设置数据转换器。

上方是一个12nm ASIC(Lightmatter副总工程师Carl Ramey在Hot Chips演讲时介绍的是14nm ASIC),用于存储内存和控制下方作为计算引擎的90nm光子芯片裸片。

该光子处理器具有64 x 64光子矩阵向量乘积计算器,可在标准数据中心工作温度下运行,总延迟时间不到200皮秒(1万亿皮秒=1秒),比晶体管计算要快几个数量级,晶体管计算需要多个时钟周期。计算引擎由50兆瓦的激光驱动。

哈里斯认为,这种低功耗光子计算芯片的优势之一,是可以与控制/内存ASIC进行3D堆叠。

基于晶体管的计算芯片会散发过多的热量。堆叠的芯片缩短了ASIC上的操作数存储区与光子芯片上的计算元件之间的轨迹线——从数据转换器到光子计算引擎的距离不到总路径的1毫米。反过来,这降低了延迟和功耗。

哈里斯说:“这里有一个很好的正反馈循环”, “节省功耗使我们堆叠,而堆叠可以节省更多功耗。”

三、更高速度、更低功耗是如何实现的?

Lightmatter光学计算阵列由DACADC模块封装,作为与数字电路的其余部分的接口

DAC接收数字输入信号,将其转换为模拟电压,并使用该电压来驱动激光器(该技术已在光纤发射器中广泛使用)。

来自该激光器的光,在进入马赫曾德尔干涉仪(MZI)后,相干光分为两束,每半束光的相位调整不同,将具有不同相位的光束组合会导致相长或相消干涉,从而有效地调制通过MZI的光的亮度(该调制可被视为乘法运算)。

在波导(承载光的“电线”)相遇之处,信号被有效地加在一起,这是光MAC的基础。

计算阵列输出的光到达光电二极管,通过机械手段实现MZI中的关键操作,改变光的相位。

Lightmatter副总工程师Carl Ramey在Hot Chips演讲解释说,其光子芯片使用了纳米光学机电系统(NOEMS)。

与MEMS器件类似,波导结构通过在下面蚀刻而悬浮,然后通过向其上方和下方的电容器板添加电荷来偏转。这成功地改变了光的相位所需的数量,并且所需功率极低。

“NOEMS设备具有一些非常惊人的性能,” Ramey说。“它们的损耗极低,静态功耗几乎为零。我们只是将一些电子倾倒到小电容器上,几乎没有泄漏——电容足够小,致动所用的动态功率也很小。(结构)也能以相对较高的速度启动,最高可达数百兆赫。”

Ramey说,Lightmatter的演示芯片具有64 x 64计算元素,但可以很容易地扩大规模。

据他介绍:“类似于基于晶体管的脉动阵列,计算量与面积成线性比例关系,“延迟也随着阵列的尺寸而缩放。因此,在一个典型的流水线晶体管设计中,您需要64个时钟周期来执行这些操作,从左到右。我们的延迟也随阵列尺寸而定,但是速度要快三个数量级。因此,即使是1000 x 1000的阵列,其延迟也会远低于纳秒。”

有趣的是,光子计算阵列消耗的功率与面积的平方根成比例。这是因为功耗主要归因于数据转换。

“当我们将每个新元素添加到阵列中时,我们将获得更高的性能,但是我们只需要付出功率平方根的代价即可。” Ramey说,“因此,我们制造的芯片越大,实际上它们的效率就越高。这与电子系统有很大不同,电子系统只是线性扩展:性能越高,功耗越大。”

除了与计算相关的能量外,还有与在芯片周围移动数据有关的能量(当今基于晶体管的大型AI芯片在硅片上移动数据可能要消耗50-100W功率)。

而通过光学计算,以光学方式移动数据,意味着不需要电源,从而节省了很多钱。结果是,光子计算设备的运行功耗不到3W,仅是其他计算方法每次推理操作所消耗能量的一小部分。

四、支持同时执行多个AI推理任务

光子计算的另一个有趣功能是并行处理能力。与光通信中使用的技术类似,可以将多个独立的数据流编码到不同波长的光上,并同时馈入计算引擎。这意味着光学计算芯片可以同时执行多个AI推理任务。

“这是光子计算的一个非常独特的特性,” Lightmatter首席执行官Nick Harris说,“这意味着您有一个物理资源,一个处理器,但它的作用就像一排处理器。”

虽然指定的光谱(1310至1600nm)在理论上可以适合至少1000路,但哈里斯说,因激光技术还不成熟,目前仅支持8路。

落地将是艰巨的挑战

据悉,Lightmatter的目标客户是当今的数据中心,包括高性能计算等可扩展系统。自动驾驶技术是一个遥远的未来发展方向,不过哈里斯承认,进入这一领域所需的可靠性工程将是“一项艰巨的任务”。

Lightmatter具有完整的软件堆栈,支持TensorFlow、PyTorch、ONNX等机器学习框架。哈里斯说,他们的目标是在两个机器学习框架之间实现即插即用。对于初创企业而言,首要挑战之一可能是如何使持怀疑态度的客户理解和接受光子计算的整个概念。

如何做到这一点呢?哈里斯回应称:“这是一个艰巨的挑战”。他介绍道,自1960年代以来的计算历史上,从来没有一种技术取代过电子晶体管做计算,人们已经尝试过,但从未成功。“我认为这是您第一次看到它的实现,而我们销售它的方式就是通过展示它的运行。”哈里斯说。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    449

    文章

    48646

    浏览量

    413249
  • AI
    AI
    +关注

    关注

    87

    文章

    27602

    浏览量

    265199
  • 自动驾驶
    +关注

    关注

    776

    文章

    13254

    浏览量

    164169
收藏 人收藏

    评论

    相关推荐

    英伟达前高管加盟Lightmatter,共绘AI计算新篇章

    科技巨擘中的职务,转而担任新兴芯片初创公司Lightmatter的首席财务官(CFO)。这一举措不仅彰显了扬科夫斯基对未来科技趋势的敏锐洞察,也标志着Lightmatter正以前所未有
    的头像 发表于 07-03 10:10 232次阅读

    Arm发布全新终端计算子系统,加速AI体验与产品上市

    全球领先的半导体知识产权(IP)提供商Arm控股有限公司(纳斯达克股票代码:ARM)今日正式推出全新的Arm终端计算子系统(CSS),以推动人工智能(AI)体验的前沿发展,并助力
    的头像 发表于 05-30 14:23 352次阅读

    PMP22165.1-适用于 Xilinx 通用自适应计算加速平台 (ACAP) 的电源 PCB layout 设计

    电子发烧友网站提供《PMP22165.1-适用于 Xilinx 通用自适应计算加速平台 (ACAP) 的电源 PCB layout 设计.pdf》资料免费下载
    发表于 05-19 10:45 0次下载
    PMP22165.1-适<b class='flag-5'>用于</b> Xilinx <b class='flag-5'>通用</b>自适应<b class='flag-5'>计算</b><b class='flag-5'>加速</b>平台 (ACAP) 的电源 PCB layout 设计

    Cadence与NVIDIA联合推出利用加速计算和生成式AI重塑设计

    中国上海,2024 年 3 月 25 日——楷登电子(美国 Cadence 公司,NASDAQ:CDNS)近日宣布,公司将深化与 NVIDIA 在 EDA、系统设计与分析、数字生物学和人工智能领域的多年合作,推出两款变革性解决方
    的头像 发表于 03-25 14:36 334次阅读

    是德科技推出AI数据中心测试平台

    是德科技近期宣布,针对蓬勃发展的AI和ML基础设施生态系统,隆重推出了全新的AI数据中心测试平台。该平台专为加速
    的头像 发表于 03-08 10:17 389次阅读

    是德科技推出AI数据中心测试平台旨在加速AI/ML网络验证和优化的创新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,针对人工智能(AI)和机器学习(ML)基础设施生态系统,推出AI数据中心测试平台,旨在
    的头像 发表于 02-29 09:32 373次阅读
    是德科技<b class='flag-5'>推出</b><b class='flag-5'>AI</b>数据中心<b class='flag-5'>测试</b>平台旨在<b class='flag-5'>加速</b><b class='flag-5'>AI</b>/ML网络验证和优化的创新

    新型光子芯片:以光子替换电子执行AI数学运算

    这种新式芯片首次巧妙地融合了纳米尺度物质操作先驱纳德·恩赫塔和硅光子(SiPh)平台理念。其中,恩赫塔通过光的运用提高数学计算速率,而硅光子平台则应用硅元素——广泛
    的头像 发表于 02-18 16:17 508次阅读

    加速计算卡与AI显卡有什么区别?

    与原理 1. 加速计算卡:加速计算卡是一种用于高性能计算的硬件设备,主要
    的头像 发表于 01-09 14:10 727次阅读

    Marvell硅光子光引擎,会加速AI的发展吗?

    Marvell的硅光子平台主要来源于对Inphi公司的收购,Inphi曾推出COLORZ 100,这是一款连接Microsoft数据中心园区的100G ZR光纤,已经成功运行了7B小时。
    的头像 发表于 12-10 15:13 915次阅读
    Marvell硅<b class='flag-5'>光子</b>光引擎,会<b class='flag-5'>加速</b><b class='flag-5'>AI</b>的发展吗?

    可以计算光最佳形状的光子芯片

    就在最近,一个由多个大学的研究人员组成的国际团队突破了这一难题,让光学无线系统的数据传输不再有障碍,该研究团队制造出的新型光子芯片计算出光的最佳形状,从而让光以最佳的效率穿过任何环境,相关研究成果发表在《自然-
    的头像 发表于 12-06 16:03 424次阅读

    AI芯片到底是什么?AI芯片技术架构有哪些?AI芯片主要有哪几种类型?

    AI芯片(Artificial Intelligence chips)是特别设计用于处理人工智能(AI)应用的芯片
    发表于 08-24 18:25 7220次阅读

    AI芯片和处理器的区别

      AI芯片是一种专门用于人工智能计算的集成电路。相较于传统的通用微处理器,AI
    的头像 发表于 08-08 16:43 1793次阅读

    AI芯片的优势和主要挑战 AI芯片和存储芯片的区别

      AI芯片也被称为AI加速器或计算卡,即专门用于处理人工智能应用中的大量
    的头像 发表于 08-03 17:19 3001次阅读

    光子集成电路(PIC)加速未来光子芯片的开发周期

    液晶技术和MEMS技术使可重新编程光子集成电路(PIC)成为可能,这些PIC能够支持多种功能,并显著加速未来光子芯片的开发周期。
    的头像 发表于 07-31 09:29 4183次阅读
    <b class='flag-5'>光子</b>集成电路(PIC)<b class='flag-5'>加速</b>未来<b class='flag-5'>光子</b><b class='flag-5'>芯片</b>的开发周期

    角逐AI算力,比英伟达最多快10倍,光芯片能成为国产之光吗?

    中信建投指出,近年来光计算AI领域呈现高速的发展,具有广阔的应用前景。以Lightmatter和Lightelligence为代表的公司推出
    的头像 发表于 07-17 14:47 1300次阅读
    角逐<b class='flag-5'>AI</b>算力,比英伟达最多快10倍,光<b class='flag-5'>芯片</b>能成为国产之光吗?