0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用光速实现深度学习,探讨光学神经网络的应用

DPVg_AI_era 来源:未知 作者:胡薇 2018-09-09 10:28 次阅读

UCLA研究人员利用3D打印打造“全光学深度衍射神经网络”,利用光的衍射路径识别目标,可实现实时的目标识别和分类任务,而且准确率相当高,网络构建成本不足50美元。

如果说GPU养大了深度学习,那么如今深度学习的胃口早已经超越了GPU。

当然,GPU在不断发展,也出现了TPU、IPU、MLU来满足这头巨兽。

深度学习对算力的需求没有止境,但受制于能耗和物理极限,基于硅基的电子元件虽然现在还能支撑,但远处那堵几乎不可逾越的高墙已然显现。

怎么办?

光速深度学习!

今天,Science发表了加州大学洛杉矶分校(UCLA)研究人员的最新研究:All-optical machine learning using diffractive deep neural networks,他们使用 3D 打印打造了一套 “全光学” 人工神经网络,可以分析大量数据并以光速识别目标。

论文地址:http://science.sciencemag.org/content/361/6406/1004

这项技术名为衍射深度神经网络(diffractive deep neural network,D²NN),它使用来自物体的光散射来识别目标。该技术基于深度学习的被动衍射层设计。

研究团队先用计算机进行模拟,然后用 3D 打印机打造出 8 平方厘米的聚合物层。每个晶圆表面都是不平整的,目的是为了衍射来自目标的光线。

衍射深度神经网络由一系列聚合物层组成,每层大约 8 平方厘米。利用网络区域内的光的衍射传播路径来识别目标。

研究人员使用 THz 级频率的光穿透 3D 打印的网络层。每一层网络由数万个像素组成,光可以通过这些像素传播。

研究人员为每类的目标分配像素,来自目标的光被衍射到已分配给该目标类型的像素上。这样,衍射深度神经网络就能够识别目标,其耗时与计算机 “看到” 目标所花费的时间相仿。

的。

D²NN: 光速实时学习,成本不到 50 美元

而随着来自不同目标的光通过 D²NN, 研究人员利用深度学习训练神经网络,以学习每个目标产生的衍射光图案。

“我们使用逐层制造的无源元件,并通过光的衍射将这些层相互连接起来,打造一个独特的全光平台,可以以光速执行机器学习任务。” 该研究团队负责人,加州大学洛杉矶分校教授 Aydogan Ozcan 表示。

“这就像一个由玻璃和镜子构成的复杂迷宫。光进入衍射网络,并在迷宫周围反射,直到其离开该区域为止。系统能够根据某目标产生的大部分光最终离开迷宫的路径,确定究竟是哪个目标。”Ozcan 说。

在实验中,研究人员将图像放在 THz 级频率的光源前。 D²NN 通过光学衍射对图像进行观察。研究人员发现,该设备可以准确识别手写的数字和衣服,这两类对象都是人工智能研究中的常用目标。

图为 D²NN 设备识别文本

在训练中,研究人员还该将设备作为成像的镜头,就像一般的相机镜头一样。

由于 D²NN 的组成可以由 3D 打印制造,成本低廉,可以构建规模更大、数量更多的层,制造出包含数亿个人工神经元(像素)的设备。规模较大的设备可以同时识别更多的目标,执行更复杂的数据分析。

D²NN 的组件成本低廉。研究人员表示,他们使用的 D²NN 设备成本不到 50 美元。

虽然这项研究使用的是 Thz 级光谱中的光,但 Ozcan 表示,也可以打造使用可见光、红外线或其他频率光谱的神经网络。他表示,除 3D 打印外,D²NN 也可以使用光刻或其他印刷技术打造。

全光学衍射深度神经网络(D²NN)的 3D 打印衍射板

D²NN的设计和性能:MNIST分类准确率达到91.75%

在论文中,研究人员介绍了D²NN框架的技术细节、实验和测试性能。

在D²NN全光学深度学习框架中,神经网络物理上由多层衍射表面(diffractive surfaces)形成,这些衍射表面协同工作以光学地执行网络可以统计学习的任意功能。虽然这个物理网络的推理和预测机制都是光学的,但其学习部分是通过计算机完成的。

研究者将这个框架称为衍射深度神经网络( diffractive deep neural network,D²NN),并通过模拟和实验证明了其推理能力。D²NN可以通过使用几个透射和/或反射层进行物理创建,其中给定层上的每个点都传输或反射进来的光波,每个点代表一个人工神经元,通过光学衍射连接到后续的层。如图1A所示。

图1:衍射深度神经网络D²NN

D²NN 中的人工神经元通过由通过振幅和相位调制的次级波连接到下一层的其他神经元。图1D是标准深度神经网络的一个类比,可以将每个点或神经元的传输或反射系数视为一个“bias”项,这是一个可学习的网络参数,在训练过程中使用误差反向传播方法进行迭代调整。

经过这一数值训练阶段, D²NN的设计就固定了,并且确定了各层神经元的传输或反射系数。这种 D²NN设计可以以光速执行所训练的特定任务,仅使用光学衍射和无源光学器件(passive optical components)或无需功率的层,从而创建一种高效、快速的方式来实现机器学习任务。

一般来说,每个神经元的相位和振幅可以是可学习的参数,在每一层提供复值调制(complex-valued modulation),这改善了衍射网络的推理性能。 对于phase-only调制的同调传输网络,每层可以近似为一个薄的光学元件(图1)。通过深度学习,在输入层馈送训练数据并通过光学衍射计算网络输出,每一层的神经元的phase value迭代调整(训练)来执行一个特定的函数。

在计算目标输出误差的基础上,通过误差反向传播算法优化网络结构及其神经元相位值。误差反向传播算法基于传统深度学习中的随机梯度下降法。

D²NN性能:MNIST手写数字数据集

为了演示 D²NN框架的性能,我们首先将其训练成一个数字分类器,对从0到9的手写数字进行自动分类(图1B)。

为了完成这项任务,我们设计了一个五层的D²NN,其中包含来自MNIST手写数字数据集的5.5万张图像(5000张验证图像)。我们将输入数字编码到D²NN输入域的幅值中,训练衍射网络将输入数字映射到10个检测器区域,每个检测器区域对应一个数字。分类标准是寻找具有最大光信号的检测器,相当于网络训练过程中的损失函数。

在训练之后,使用来自MNIST测试数据集的10000个图像(未用作训练或验证图像集)对D²NN数字分类器进行数值测试,并且实现了91.75%的分类精度(图3C)。

根据这些数值结果,我们将这个5层的D²NN 设计3D打印出来(下图),每一层的面积为8cm×8cm,然后在衍射网络的输出平面定义10个检测器区域(图1B)。

图2:3D打印的D²NN的实验测试

然后,我们使用0.4 THz的连续波光照来测试网络的推理性能(图2,C和D)。

每一层神经元的相位值用3D打印神经元的相对厚度进行物理编码。对这个5层的D²NN设计的数值测试显示,在 ~10000幅测试图像中,分类准确率达到91.75%(图3C)。

图3: D²NN手写数字识别器的性能

D²NN性能:Fashion-MNIST数据集

接下来,为了测试D²NN框架的分类性能,研究者使用了一个更复杂的图像数据集——Fashion-MNIST数据集,其中包含10个类别的时尚产品

D²NN对Fashion-MNIST数据集的分类结果如下图所示。具有N = 5个衍射层的phase-only和complex valued的D²NN的分类精度分别达到81.13%和86.33%。

通过将衍射层的数量增加到N = 10,并将神经元的总数增加到40万,D²NN的分类精度提高到86.60%。对比而言,在已有研究中,基于卷积神经网络的标准深度学习,使用~890万可学习参数和~250万个神经元,Fashion-MNIST分类准确度的最高性能为96.7%。

光学神经网络的应用

光学电路深度学习是一项重大突破,而且其现实应用已经逐渐

根据光学领域权威期刊Optica的报道,美国斯坦福大学的研究人员已经证明,可以直接在光学芯片上训练人工神经网络。这一重大突破表明,光学电路可以实现基于电子的人工神经网络的关键功能,从而可以以更便宜、更快速和更节能的方式执行语音识别、图像识别等复杂任务。

不仅如此,斯坦福的另一组研究人员还研究出一套小型AI成像系统,采用双层光学-电子混合计算技术,成像精度和速度均达到电子计算处理器水平。具体说,研究人员在电子计算之前加上一层光学计算,这种AI成像系统在低光照条件下具备更强的成像能力,每个立体像素上的光电子密度最高可达几十个,同时节约了大量本该用于计算的时间和成本。

具体到这项研究,UCLA的研究团队表示,他们的 D²NN 设备可用于全光学图像分析、特征检测和对象分类任务,还可以实现使用 D²NN 执行任务的新相机设计和光学组件。

例如,使用该技术的无人驾驶汽车可以立即对停车标志作出反应,一旦收到从标志衍射来的光,D²NN 就可以读取标志信息。该技术还可用于对大量目标的分类任务,比如在数百万细胞样本中寻找疾病的迹象。

“这项研究为基于人工智能的被动设备提供了新机会,可以对数据和图像进行实时分析,并对目标进行分类。”Ozcan 说。“这种光学人工神经网络设备直观地模拟了大脑处理信息的方式,具备很高的可扩展性,可以应用到新的相机设计和独特的光学组件设计中,也可用于医疗技术、机器人、安全等领域。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4764

    浏览量

    100542
  • 深度学习
    +关注

    关注

    73

    文章

    5493

    浏览量

    120982

原文标题:Science重磅!用光速实现深度学习,跟GPU说再见

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    深度学习中的卷积神经网络模型

    深度学习近年来在多个领域取得了显著的进展,尤其是在图像识别、语音识别和自然语言处理等方面。卷积神经网络作为深度学习的一个分支,因其在图像处理
    的头像 发表于 11-15 14:52 272次阅读

    简单认识深度神经网络

    深度神经网络(Deep Neural Networks, DNNs)作为机器学习领域中的一种重要技术,特别是在深度学习领域,已经取得了显著的
    的头像 发表于 07-10 18:23 939次阅读

    人工神经网络的案例分析

    元之间的连接和信息传递机制,实现对复杂数据的处理、模式识别及预测等功能。本文将通过几个具体案例分析,详细探讨人工神经网络在不同领域的应用,同时简要介绍深度
    的头像 发表于 07-08 18:20 682次阅读

    深度神经网络与基本神经网络的区别

    探讨深度神经网络(Deep Neural Networks, DNNs)与基本神经网络(通常指传统神经网络或前向
    的头像 发表于 07-04 13:20 683次阅读

    深度神经网络的设计方法

    深度神经网络(Deep Neural Networks, DNNs)作为人工智能领域的重要技术之一,通过模拟人脑神经元之间的连接,实现了对复杂数据的自主
    的头像 发表于 07-04 13:13 410次阅读

    神经网络芯片与传统芯片的区别和联系

    应运而生,成为解决深度学习计算问题的关键技术之一。本文将从多个角度探讨神经网络芯片与传统芯片的区别和联系。 神经网络芯片与传统芯片的基本概念
    的头像 发表于 07-04 09:31 724次阅读

    神经网络的基本原理及Python编程实现

    神经网络作为深度学习算法的基本构建模块,模拟了人脑的行为,通过互相连接的节点(也称为“神经元”)实现对输入数据的处理、模式识别和结果预测等功
    的头像 发表于 07-03 16:11 527次阅读

    卷积神经网络训练的是什么

    、训练过程以及应用场景。 1. 卷积神经网络的基本概念 1.1 卷积神经网络的定义 卷积神经网络是一种前馈深度学习模型,其核心思想是利用卷积
    的头像 发表于 07-03 09:15 352次阅读

    深度学习与卷积神经网络的应用

    到自然语言处理,深度学习和CNN正逐步改变着我们的生活方式。本文将深入探讨深度学习与卷积神经网络
    的头像 发表于 07-02 18:19 813次阅读

    卷积神经网络的原理与实现

    1.卷积神经网络(Convolutional Neural Networks,简称CNN)是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。 卷积神经网络是一种前馈
    的头像 发表于 07-02 16:47 498次阅读

    卷积神经网络的基本结构及其功能

    。 引言 深度学习是机器学习的一个分支,它通过模拟人脑神经网络的结构和功能,实现对数据的自动学习
    的头像 发表于 07-02 14:45 1197次阅读

    深度神经网络模型cnn的基本概念、结构及原理

    ,其核心是构建具有多层结构的神经网络模型,以实现对复杂数据的高效表示和处理。在众多深度学习模型中,卷积神经网络(CNN)因其在图像识别等领域
    的头像 发表于 07-02 10:11 9557次阅读

    深度神经网络模型有哪些

    、Sigmoid或Tanh。 卷积神经网络(Convolutional Neural Networks,CNN): 卷积神经网络深度学习中最重
    的头像 发表于 07-02 10:00 1178次阅读

    神经网络架构有哪些

    神经网络架构是机器学习领域中的核心组成部分,它们模仿了生物神经网络的运作方式,通过复杂的网络结构实现信息的处理、存储和传递。随着
    的头像 发表于 07-01 14:16 617次阅读

    详解深度学习神经网络与卷积神经网络的应用

    在如今的网络时代,错综复杂的大数据和网络环境,让传统信息处理理论、人工智能与人工神经网络都面临巨大的挑战。近些年,深度学习逐渐走进人们的视线
    的头像 发表于 01-11 10:51 1918次阅读
    详解<b class='flag-5'>深度</b><b class='flag-5'>学习</b>、<b class='flag-5'>神经网络</b>与卷积<b class='flag-5'>神经网络</b>的应用