IBM新研究，使用光学器件打造的“全光学”深度神经网络-电子发烧友网

近日，Nature刊载IBM新研究，使用光学器件打造的“全光学”深度神经网络可以比传统计算方式的能效更高，同时具备可扩展性、无需光电转换和高带宽等优势。这一发现可能给未来光学神经网络加速器的出现打下基础。

光纤能够以光的形式在世界范围内传输数据，成为现代电信技术的支柱。不过如果需要分析这些传输数据，要将其从光信号转换为电子信号，然后用电子设备进行处理。曾经有一段时间，光学被认为是未来最具潜力的计算技术的基础，但与电子计算机的快速进步相比，光学计算技术的竞争力明显不足。

不过，在过去几年中，业界越来越关注对计算能源的成本问题。因此，光学计算系统再次受到关注。光学计算的能耗低，又能作为AI 算法（如深度神经网络（DNN））的专用加速硬件。近日，Feldmann等人在《自然》期刊上发表了这种“全光学网络实现”的最新进展。

论文地址：

https://www.nature.com/articles/s41586-019-1157-8

深度神经网络包括多层人工神经元和人工突触。这些连接的强度称为网络权重，可以是阳性，表示神经元的兴奋，或阴性，表示神经元的抑制。网络会尽力将实际输出和期望输出之间的差异实现最小化，从而改变突触的权重，来执行图像识别等任务。

CPU和其他硬件加速器通常用于DNN的计算。DNN的训练可以使用已知数据集，而经过训练后的DNN可以用来推理任务中的未知数据。虽然计算量很大，但计算操作的多样性不会很高，因为“乘法累加”操作在许多突触权重和神经元激励中占主导地位。

DNN在计算精度较低时仍能正常工作。因此，DNN网络代表了非传统计算技术的潜在机会。研究人员正在努力打造基于新型非易失性存储器件的DNN加速器。这类设备在切断电源时也能保存信息，通过模拟电子计算提升DNN的速度和能效。

那么，为什么不考虑使用光学器件呢？导光部件中可以包含大量数据 - 无论是用于电信的光纤还是用于光子芯片上的波导。在这种波导内部，可以使用“波分复用”技术，让许多不同波长的光一起传播。然后可以以与电子到光学调制和光电子检测相关的可用带宽限制的速率调制（以可以携带信息的方式改变）每个波长。

图1全光学脉冲神经元回路

使用谐振器可以实现单个波长的添加或移除，就像对货车的装货和卸货一样。使用微米级环形谐振器可以构建DNN网络突触权重阵列。这种谐振器可以采用热调制，电光调制，或通过相变材料调制。这些材料可以在非晶相和结晶相之间切换，不同的材料的吸光能力差别很大。在理想条件下，进行乘法累加运算的功耗很低。

Feldmann研究团队在毫米级光子芯片上实现了“全光学神经网络”，其中网络内没有使用光电转换。输入的数据被电子调制到不同的波长上注入网络，但此后所有数据都保留在芯片上。利用集成相变材料实现突触权重的调节和神经元的集成。

图2人工神经元的脉冲生成与操作

本文作者小规模地展示了有监督和无监督的学习 - 即使用标记数据实现训练（DNN学习的方式），以及使用未标记的数据训练（类似人类的学习方式）。

图3基于相变全光学神经元系统实现监督学习和非监督学习

因为权重表达是通过光的吸收实现的，所以负权重需要更大的偏置信号，该信号不能激活相变材料。一种替代方法是使用Mach-Zehnder干涉仪的装置，将单个波导分成两个臂，然后重新组合，这时的透射光量取决于两个传播路径之间光学相位的差异。然而，要想将这种方法与波分复用相结合可能难度较大，因为每个干涉仪的臂需要为每个波长引入适当的相位差。

全光学实现的DNN仍然存在重大挑战。在理想情况下，它们的总功率使用率可能较低，经常需要热光功率来调节和维持每个Mach-Zehnder干涉仪臂中的光学相位差异。

图4全光学神经网络的可扩展架构

此外，对注入含有相变材料的系统的总光功率必须仔细校准，以使材料对输入信号的响应符合预期。尽管相变材料也可以用于调整Mach-Zehnder相位，但是材料吸收光的强度和减慢光速之间会出现不可避免的交叉耦合，这会增加系统的复杂性。

传统的DNN规模已经发展到很大，可能包含数千个神经元和数百万个突触。但是光子网络的波导需要彼此间隔很远才能防止耦合，并且避免急剧弯曲以防止光离开波导。因为两个波导的交叉可能会将不需要的功率注入错误路径，这对光子芯片设计的2D特性造成了实质性的限制。

图5单层脉冲神经网络的实验实现

实现光学器件打造神经网络需要很长的距离和很大的面积，但是每个光学结构的关键部分的制造需要高精度。这是因为波导和耦合区域，比如在每个微环谐振器的入口和出口处，必须达到相应网络性能所需的精确尺寸。对于如何制造小型微环谐振器也存在诸多限制。

最后，调制技术提供的光学效应较弱，需要很长的相互作用区域，以使其对通过的光的有限影响能够达到显著水平。

Feldmann 团队的研究中所取得的进步，有望推动该领域的未来发展，该研究可能会为未来高能效、可扩展的光学神经网络加速器的出现打下基础。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

加速器

加速器

+关注

关注
2

文章
802

浏览量
37940
神经网络

神经网络

+关注

关注
42

文章
4774

浏览量
100912
光学器件

光学器件

+关注

关注
1

文章
144

浏览量
11979

原文标题：Nature最新：下一代计算架构革命，从“全光学神经网络”开始

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

详解深度学习、神经网络与卷积神经网络的应用

处理技术也可以通过深度学习来获得更优异的效果，比如去噪、超分辨率和跟踪算法等。为了跟上时代的步伐，必须对深度学习与神经网络技术有所学习和研究。本文将介绍

发表于 01-11 10:51 •2215次阅读

详解<b class='flag-5'>深度</b>学习、<b class='flag-5'>神经网络</b>与卷积<b class='flag-5'>神经网络</b>的应用

基于光学衍射神经网络的轨道角动量复用全息技术的设计与实验研究

随着神经网络的发展，光学神经网络（ONN）的研究受到广泛关注。研究人员从衍射光学、散射光、光干涉

发表于 12-07 17:39 •1961次阅读

基于<b class='flag-5'>光学</b>衍射<b class='flag-5'>神经网络</b>的轨道角动量复用全息技术的设计与实验<b class='flag-5'>研究</b>

全连接神经网络和卷积神经网络有什么区别

全连接神经网络和卷积神经网络的区别

发表于 06-06 14:21

基于光学芯片的神经网络训练解析，不看肯定后悔

基于光学芯片的神经网络训练解析，不看肯定后悔

发表于 06-21 06:33

深度神经网络是什么

多层感知机深度神经网络in collaboration with Hsu Chung Chuan, Lin Min Htoo, and Quah Jia Yong. 与许忠传，林敏涛和华佳勇合作

发表于 07-12 06:35

卷积神经网络模型发展及应用

卷积神经网络模型发展及应用转载****地址：http://fcst.ceaj.org/CN/abstract/abstract2521.shtml深度学习是机器学习和人工智能研究的最新趋势，作为一个

发表于 08-02 10:39

直接在光学芯片上训练人工神经网络

新的训练协议在具有可调谐光束分离器的光学电路运行，通过改变光学移相器的设置进行调整。具体来说，该方法是将编码有待处理信息的激光束发射到光学电路中，由光波导通过光束分离器进行传输，像旋钮一样进行调整，以训练

发表于 07-29 10:14 •3812次阅读

用光速实现深度学习，探讨光学神经网络的应用

光学人工神经网络直观模拟大脑处理信息的方式，可应用到新的相机设计和光学组件设计中，也可用于医疗技术、机器人、安全等领域。

发表于 09-09 10:28 •7030次阅读

基于相变全光学神经元系统实现监督学习和非监督学习

近日，Nature刊载IBM新研究，使用光学器件打造的“全光

发表于 05-12 11:47 •3462次阅读

Nature下一代计算架构革命从全光学神经网络开始

近日，Nature刊载IBM新研究，使用光学器件打造的“全光

发表于 05-13 11:06 •2797次阅读

UCLA新型光学神经网络可立即识别物体

美国加州大学洛杉矶分校研发了一种光学神经网络，可能可以生产出无需额外计算机处理就可立即识别物体的光学设备。

发表于 04-15 17:13 •2113次阅读

完全通过光学，不要计算机也能构建个神经网络？

在传统混合光学的神经网络中，光学组件通常用于线性运算，而非线性激活函数通常使用电子的方式实现。这主要因为非线性光学元器件需要高功率的激光器，

发表于 04-17 09:57 •4423次阅读

衍射光学神经网络可以满足巨大的数据需求

随着神经网络的规模和功率的增长，当在传统电子设备上运行时，它们越来越需要能量。这就是为什么一些科学家一直在研究光学计算作为一种有前途的下一代人工智能媒介。这种方法使用光而不是电来执行计

发表于 02-20 14:03 •1318次阅读

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

深度神经网络是一种基于神经网络的机器学习算法，其主要特点是由多层神经元构成，可以根据数据自动调整神经元之间的权重，从而实现对大规模数据进行预

发表于 08-21 17:07 •4185次阅读

深度神经网络模型有哪些

模型：多层感知器（Multilayer Perceptron，MLP）：多层感知器是最基本的深度神经网络模型，由多个全连接层组成。每个隐藏层的神经元数量可以不同，通常使用激活函数如

发表于 07-02 10:00 •1524次阅读

搜索历史

IBM新研究，使用光学器件打造的“全光学”深度神经网络

评论

详解深度学习、神经网络与卷积神经网络的应用

基于光学衍射神经网络的轨道角动量复用全息技术的设计与实验研究

全连接神经网络和卷积神经网络有什么区别

基于光学芯片的神经网络训练解析，不看肯定后悔

深度神经网络是什么

卷积神经网络模型发展及应用

直接在光学芯片上训练人工神经网络

用光速实现深度学习，探讨光学神经网络的应用

基于相变全光学神经元系统实现监督学习和非监督学习

Nature下一代计算架构革命从全光学神经网络开始

UCLA新型光学神经网络可立即识别物体

完全通过光学，不要计算机也能构建个神经网络？

衍射光学神经网络可以满足巨大的数据需求

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

深度神经网络模型有哪些