深度学习研究之PEFT技术解析

最近，深度学习的研究中出现了许多大型预训练模型，例如 GPT-3、BERT 等，这些模型可以在多种自然语言处理任务中取得优异的性能表现。而其中，ChatGPT 模型因为在对话生成方面的表现而备受瞩目，成为了自然语言处理领域的热门研究方向。然而，这些大型预训练模型的训练成本非常高昂，需要庞大的计算资源和大量的数据，一般人难以承受。这也导致了一些研究人员难以重复和验证先前的研究成果。为了解决这个问题，研究人员开始研究 Parameter-Efficient Fine-Tuning（PEFT）技术。 PEFT 技术旨在通过最小化微调参数的数量和计算复杂度，来提高预训练模型在新任务上的性能，从而缓解大型预训练模型的训练成本。这样一来，即使计算资源受限，也可以利用预训练模型的知识来迅速适应新任务，实现高效的迁移学习。因此，PEFT 技术可以在提高模型效果的同时，大大缩短模型训练时间和计算成本，让更多人能够参与到深度学习研究中来。下面我们将深入探讨 PEFT 的一些主要做法。

Adapter Tuning

谷歌的研究人员首次在论文《Parameter-Efficient Transfer Learning for NLP》提出针对 BERT 的 PEFT 微调方式，拉开了 PEFT 研究的序幕。他们指出，在面对特定的下游任务时，如果进行 Full-fintuning（即预训练模型中的所有参数都进行微调），太过低效；而如果采用固定预训练模型的某些层，只微调接近下游任务的那几层参数，又难以达到较好的效果。于是他们设计了如下图所示的 Adapter 结构，将其嵌入 Transformer 的结构里面，在训练时，固定住原来预训练模型的参数不变，只对新增的 Adapter 结构进行微调。同时为了保证训练的高效性（也就是尽可能少的引入更多参数），他们将 Adapter 设计为这样的结构：首先是一个 down-project 层将高维度特征映射到低维特征，然后过一个非线形层之后，再用一个 up-project 结构将低维特征映射回原来的高维特征；同时也设计了 skip-connection 结构，确保了在最差的情况下能够退化为 identity。

从实验结果来看，该方法能够在只额外对增加的 3.6% 参数规模（相比原来预训练模型的参数量）的情况下取得和 Full-finetuning 接近的效果（GLUE 指标在 0.4% 以内）。

Prefix Tuning

Prefix Tuning 方法由斯坦福的研究人员提出，与 Full-finetuning 更新所有参数的方式不同，该方法是在输入 token 之前构造一段任务相关的 virtual tokens 作为 Prefix，然后训练的时候只更新 Prefix 部分的参数，而 Transformer 中的其他部分参数固定。该方法其实和构造 Prompt 类似，只是 Prompt 是人为构造的“显式”的提示，并且无法更新参数，而 Prefix 则是可以学习的“隐式”的提示。同时，为了防止直接更新 Prefix 的参数导致训练不稳定的情况，他们在 Prefix 层前面加了 MLP 结构（相当于将 Prefix 分解为更小维度的 Input 与 MLP 的组合后输出的结果），训练完成后，只保留 Prefix 的参数。实验结果也说明了 Prefix Tuning 的方式可以取得不错的效果。

除此之外，作者还做了一系列的消融实验说明该方法的有效性：

1. Prefix 长度的影响：不同的任务所需要的 Prefix 的长度有差异。

2. Full vs Embedding-only：作者对比了 Embedding-only（只有最上层输入处的 Embedding 作为参数更新，后续的参数固定）和 Full（每一层的 Prefix 相关的参数都训练）的方式的效果。

3. Prefixing vs Infixing：对比了 [PREFIX; x; y] 方式与 [x; INFIX; y] 方式的差异，还是 Prefix 方式最好。

4. Initialization：用任务相关的 Prompt 去初始化 Prefix 能取得更好的效果。

Prompt Tuning

论文《The Power of Scale for Parameter-Efficient Prompt Tuning》我给这篇文章取了个新名字：Scale is All You Need，总的来说就是，只要模型规模够大，简单加入 Prompt tokens 进行微调，就能取得很好的效果。该方法可以看作是 Prefix Tuning 的简化版本，只在输入层加入 prompt tokens，并不需要加入 MLP 进行调整来解决难训练的问题，主要在 T5 预训练模型上做实验。似乎只要预训练模型足够强大，其他的一切都不是问题。作者也做实验说明随着预训练模型参数量的增加，Prompt Tuning 的方法会逼近 Fine-tune 的结果。

3.1 实验

作者做了一系列对比实验，都在说明：随着预训练模型参数的增加，一切的问题都不是问题，最简单的设置也能达到极好的效果。

a）Prompt 长度影响：模型参数达到一定量级时，Prompt 长度为 1 也能达到不错的效果，Prompt 长度为 20 就能达到极好效果。

b）Prompt 初始化方式影响：Random Uniform 方式明显弱于其他两种，但是当模型参数达到一定量级，这种差异也不复存在。

c）预训练的方式：LM Adaptation 的方式效果好，但是当模型达到一定规模，差异又几乎没有了。

d）微调步数影响：模型参数较小时，步数越多，效果越好。同样随着模型参数达到一定规模，zero shot 也能取得不错效果。

P-Tuning

4.1 V1

P-Tuning 方法的提出主要是为了解决这样一个问题：大模型的 Prompt 构造方式严重影响下游任务的效果。

P-Tuning 提出将 Prompt 转换为可以学习的 Embedding 层，只是考虑到直接对 Embedding 参数进行优化会存在这样两个挑战：

Discretenes：对输入正常语料的 Embedding 层已经经过预训练，而如果直接对输入的 prompt embedding 进行随机初始化训练，容易陷入局部最优。

Association：没法捕捉到 prompt embedding 之间的相关关系。

作者在这里提出用 MLP+LSTM 的方式来对 prompt embedding 进行一层处理

4.1.1 与 Prefix-Tuning 的区别

这篇文章（2021-03）和 Prefix-Tuning（2021-01）差不多同时提出，做法其实也有一些相似之处，主要区别在

Prefix Tuning 是将额外的 embedding 加在开头，看起来更像是模仿 Instruction 指令；而 P-Tuning 的位置则不固定。

Prefix Tuning 通过在每个 Attention 层都加入 Prefix Embedding 来增加额外的参数，通过 MLP 来初始化；而 P-Tuning 只是在输入的时候加入 Embedding，并通过 LSTM+MLP 来初始化。

4.2 V2

论文《P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Ac ross Scales and Tasks》从标题就可以看出这篇文章的野心，P-Tuning v2 的目标就是要让 Prompt Tuning 能够在不同参数规模的预训练模型、针对不同下游任务的结果上都达到匹敌 Fine-tuning 的结果。那也就是说当前 Prompt Tuning 方法未能在这两个方面都存在局限性。

不同模型规模：Prompt Tuning 和 P-tuning 这两种方法都是在预训练模型参数规模够足够大时，才能达到和 Fine-tuning 类似的效果，而参数规模较小时效果则很差。

不同任务类型：Prompt Tuning 和 P-tuning 这两种方法在 sequence tagging 任务上表现都很差。

4.2.1 主要结构

相比 Prompt Tuning 和 P-tuning 的方法，P-tuning v2 方法在多层加入了 Prompts tokens 作为输入，带来两个方面的好处： 1. 带来更多可学习的参数（从 P-tuning 和 Prompt Tuning 的 0.1% 增加到0.1%-3%），同时也足够 parameter-efficient。 2. 加入到更深层结构中的 Prompt 能给模型预测带来更直接的影响。

4.2.2 几个关键设计因素

Reparameterization：Prefix Tuning 和 P-tuning 中都有 MLP 来构造可训练的 embedding。本文发现在自然语言理解领域，面对不同的任务以及不同的数据集，这种方法可能带来完全相反的结论。

Prompt Length：不同的任务对应的最合适的 Prompt Length 不一样，比如简单分类任务下 length=20 最好，而复杂的任务需要更长的 Prompt Length。

Multi-task Learning 多任务对于 P-Tuning v2 是可选的，但可以利用它提供更好的初始化来进一步提高性能。

Classification Head 使用 LM head 来预测动词是 Prompt Tuning 的核心，但我们发现在完整的数据设置中没有必要这样做，并且这样做与序列标记不兼容。P-tuning v2 采用和 BERT 一样的方式，在第一个 token 处应用随机初始化的分类头。

4.2.3 实验结果

不同预训练模型大小下的表现，在小模型下取得与Full-finetuning相近的结果，并远远优于P-Tuning。

不同任务下的 P-Tuning v2 效果都很好，而 P-Tuning 和 Prompt Learning 效果不好；同时，采用多任务学习的方式能在多数任务上取得最好的结果。

Verbalizer with LM head v.s. [CLS] label with linear head，两种方式没有太明显的区别

Prompt depth，在加入相同层数的 Prompts 前提下，往更深层网络加效果优于往更浅层网络（只有 BoolQ 中 17-24 反而低于 1-8 是例外）。

LoRA

微软和 CMU 的研究者指出，现有的一些 PEFT 的方法还存在这样一些问题：

由于增加了模型的深度从而额外增加了模型推理的延时，如 Adapter 方法

Prompt 较难训练，同时减少了模型的可用序列长度，如 Prompt Tuning、Prefix Tuning、P-Tuning 方法

往往效率和质量不可兼得，效果差于 full-finetuning

有研究者对语言模型的参数进行研究发现：语言模型虽然参数众多，但是起到关键作用的还是其中低秩的本质维度（low instrisic dimension）。本文受到该观点的启发，提出了 Low-Rank Adaption（LoRA），设计了如下所示的结构，在涉及到矩阵相乘的模块，引入 A、B 这样两个低秩矩阵模块去模拟 Full-finetune 的过程，相当于只对语言模型中起关键作用的低秩本质维度进行更新。

这么做就能完美解决以上存在的 3 个问题：

相比于原始的 Adapter 方法“额外”增加网络深度，必然会带来推理过程额外的延迟，该方法可以在推理阶段直接用训练好的 A、B 矩阵参数与原预训练模型的参数相加去替换原有预训练模型的参数，这样的话推理过程就相当于和 Full-finetune 一样，没有额外的计算量，从而不会带来性能的损失。

由于没有使用 Prompt 方式，自然不会存在 Prompt 方法带来的一系列问题。

该方法由于实际上相当于是用 LoRA 去模拟 Full-finetune 的过程，几乎不会带来任何训练效果的损失，后续的实验结果也证明了这一点。

在实验中，研究人员将这一 LoRA 模块与 Transformer 的 attention 模块相结合，在 RoBERTa 、DeBERTa、GPT-2 和 GPT-3 175B 这几个大模型上都做了实验，实验结果也充分证明了该方法的有效性。

5.1 Towards a Unified View of PETL

这篇 ICLR2022 的文章研究了典型的 PEFT 方法，试图将 PEFT 统一到一个框架下，找出它们起作用的具体原因，并进行改进。主要研究了三个问题：

典型的PEFT方法有什么联系？

典型的PEFT方法中是哪些关键模块在起作用？

能否对这些关键模块进行排列组合，找出更有用的 PEFT 方法？

5.1.1 通用形式

通过对 Prefix Tuning 的推导，得出了和 Adapter Tuning 以及 LoRA 形式一致的形式。

更近一步地，可以将这些 Tuning 的方法统一在同一套框架下，

包括这几大要素：

的形式

嵌入 Transformer 结构的方式（分为 Parrell 和 Sequential 两种。Parallel 指的是在输入层嵌入，这样与原有结构可以并行计算；Sequential 指的是在输出层嵌入，相当于增加了网路的深度，与原有结构存在依赖关系）

修改的表示层（主要指对 attention层的修改还是对 ffn 层的修改）

组合方式。怎么与原有的参数组合，包括简单相加（Adapter）、门控式（Prefix Tuning）、缩放式（LoRA）三种）

根据这个统一的框架，还另外设计了三种变体Parallel Adapter、Multi-head Parallel Adapter、Scaled Parallel Adapter。

5.1.2 一些实验

哪种嵌入形式更好：Parallel or Sequencial？

答案是：Parallel 更好

对哪块结构做修改更好？Attention or FFN？

当微调的参数量较多时，从结果来看，对 FFN 层进行修改更好。一种可能的解释是 FFN 层学到的是任务相关的文本模式，而 Attention 层学到的是成对的位置交叉关系，针对新任务并不需要进行大规模调整。

当微调参数量较少（0.1%）时，对 Attention 进行调整效果更好。

哪种组合方式效果更好？ 从结果来看，缩放式的组合效果更好。

5.1.3 结论

基于以上的经验，

Scaled parallel adapter is the best variant to modify FFN

FFN can better utilize modification at larger capacities

modifying head attentions like prefix tuning can achieve strong performance with only 0.1% parameters

研究者设计出最新的结构 MAM Adapter，取得了最好的效果：

编辑：黄飞

阅读全文

深度学习(119798) 深度学习(119798)
自然语言处理(13090) 自然语言处理(13090)

深度学习的硬件架构解析

深度学习在这十年，甚至是未来几十年内都有可能是最热门的话题。虽然深度学习已是广为人知了，但它并不仅仅包含数学、建模、学习和优化。算法必须在优化后的硬件上运行，因为学习成千上万的数据可能需要长达几周的时间。因此，深度学习网络亟需更快、更高效的硬件。接下来，让我们重点来看深度学习的硬件架构。

2016-11-18 16:00:37

5544

流体力学深度学习建模技术研究进展

维度高、非线性强、数据量大是流体力学问题的主要特点。近年来火热的深度学习技术由于以数据驱动为主、可以解决高维复杂问题，目前已在流体力学领域得到了一定应用。文章结合课题组近期研究探讨了流体力学深度学习建模技术的最新进展。

2022-09-12 10:05:00

544

基于深度学习的三维点云配准方法

基于深度学习的三维点云配准方法成为研究的主流，并随之诞生了DeepVCP、DGR、Predator等著名的方法。

2022-11-29 11:41:24

1338

2017全国深度学习技术应用大会

单位：中国电子学会学术交流中心　　四、大会主席：王亮中科院自动化研究所　　五、大会交流形式　　1.特邀演讲：大会将邀请国内深度学习技术领域的著名专家，就深度学习技术的应用和最新动态做特邀报告

2017-03-22 17:16:00

深度学习技术的开发与应用

降落任务1.DQN/Double DQN/Dueling DQN2.PER高频问题：1.深度强化学习网络训练稳定性 2.探索与利用关键点：1.经验回放技术的实现2.目标网络更新实操解析与训练四实验

2022-04-21 14:57:39

深度学习DeepLearning实战

一：深度学习DeepLearning实战时间地点：1 月 15日— 1 月18 日二：深度强化学习核心技术实战时间地点： 1 月 27 日— 1 月30 日(第一天报到授课三天；提前环境部署电脑

2021-01-09 17:01:54

深度学习与数据挖掘的关系

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。晦涩难懂的概念，略微有些难以

2018-07-04 16:07:53

深度学习介绍

汽车安全系统的发展进步中发挥重要的作用。而这些系统远不止仅供典型消费者群体掌握和使用。深度学习这一概念在几十年前就已提出，但如今它与特定的应用程序、技术以及通用计算平台上的可用性能更密切相关。深度学习

2022-11-11 07:55:50

深度学习入门之基于python的理论与实现

深度学习入门-基于python的理论与实现(2)

2020-06-19 11:22:23

深度学习在预测和健康管理中的应用

方法方面的最新进展，目的是发现研究差距并提出进一步的改进建议。在简要介绍了几种深度学习模型之后，我们回顾并分析了使用深度学习进行故障检测，诊断和预后的应用。该调查验证了深度学习对PHM中各种类型的输入

2021-07-12 06:46:47

深度学习存在哪些问题？

深度学习常用模型有哪些？深度学习常用软件工具及平台有哪些？深度学习存在哪些问题？

2021-10-14 08:20:47

深度学习开源项目的绘画实现过程

21小时上手深度学习2-开源项目之绘画

2019-05-20 12:31:34

深度学习框架只为GPU?

CPU优化深度学习框架和函数库机器学***器

2021-02-22 06:01:02

深度学习模型是如何创建的？

具有深度学习模型的嵌入式系统应用程序带来了巨大的好处。深度学习嵌入式系统已经改变了各个行业的企业和组织。深度学习模型可以帮助实现工业流程自动化，进行实时分析以做出决策，甚至可以预测预警。这些AI

2021-10-27 06:34:15

深度学习线下技术知识讲座

深度学习应用在测量与测绘技术

2019-05-16 17:21:50

深度强化学习实战

2021-01-10 13:42:26

解析深度学习：卷积神经网络原理与视觉实践

2020-06-14 22:21:12

AUTOSAR架构深度解析精选资料分享

AUTOSAR架构深度解析本文转载于：AUTOSAR架构深度解析AUTOSAR的分层式设计，用于支持完整的软件和硬件模块的独立性(Independence)，中间RTE(Runtime Environment)作为虚拟功能...

2021-07-28 07:02:13

AUTOSAR架构深度解析精选资料推荐

AUTOSAR架构深度解析本文转载于：AUTOSAR架构深度解析目录AUTOSAR架构深度解析AUTOSAR分层结构及应用软件层功能应用软件层虚拟功能总线VFB及运行环境RTE基础软件层(BSW)层

2021-07-28 07:40:15

Anaconda之tensorflow：深度学习之Anaconda下安装tensorflow正确运行之史上最强攻略

2018-12-21 10:40:30

C语言深度解析

C语言深度解析，本资料来源于网络，对C语言的学习有很大的帮助，有着较为深刻的解析，可能会对读者有一定的帮助。

2023-09-28 07:00:01

I2C通信设计深度解析

2012-08-12 21:31:58

MATLAB机器学习与深度学习核心技术应用培训班

MATLAB机器学习与深度学习核心技术应用培训班备十余年MATLAB编程开发经验，机器学习、深度学习领域一线实战专家主讲。培训时间：11月09日-11月12日培训地点：北京理工大学（中关村

2018-10-23 16:51:05

Nanopi深度学习之路(1)深度学习框架分析

学习，也就是现在最流行的深度学习领域，关注论坛的朋友应该看到了，开发板试用活动中有【NanoPi K1 Plus试用】的申请，介绍中NanopiK1plus的高大上优点之一就是“可运行深度学习算法的智能

2018-06-04 22:32:12

Py之TFCudaCudnn：Win10下安装深度学习框架Tensorflow+Cuda+Cudnn最简单最快捷最详细攻略

2018-12-20 10:35:16

TI AWR1642 学习笔记4之串口数据流解析精选资料分享

TI AWR1642 学习笔记4之串口数据流解析背景：在不使用采集板的情况下，怎么去解析AWR1642 data port打印的数据流，我使用到的工具有串口助手（用于串口数据的打印与查看

2021-07-27 07:59:52

Zstack中串口操作的深度解析(一)

本帖最后由 eehome 于 2013-1-5 10:06 编辑 Zstack中串口操作的深度解析(一)欢迎研究ZigBee的朋友和我交流。。。

2012-08-12 21:11:29

java经典面试题深度解析

免费视频教程：java经典面试题深度解析对于很多初学者来说，学好java在后期面试的阶段都没什么经验，为了让大家更好的了解面试相关知识，今天在这里给大家分享了一个java经典面试题深度解析的免费视频

2017-06-20 15:16:08

java经典面试题深度解析免费视频教程分享

java经典面试题深度解析免费视频教程分享对于很多初学者来说，学好java在后期面试的阶段都没什么经验，为了让大家更好的了解面试相关知识，今天在这里给大家分享了一个java经典面试题深度解析

2017-06-23 15:22:06

【HarmonyOS HiSpark AI Camera】基于深度学习的目标检测系统设计

项目名称：基于深度学习的目标检测系统设计试用计划：尝试在硬件平台实现对Yolo卷积神经网络的加速运算，期望提出的方法能够使目标检测技术更便捷，运用领域更广泛。针对课题的研究一是研究基于开发板低功耗

2020-09-25 10:11:49

【详解】FPGA：深度学习的未来？

，则使得计算机视觉、语音识别和自然语言处理等关键领域实现了重大的性能突破。对这些数据驱动技术的研究被称为深度学习，如今正受到技术界两个重要群体的关注：一是希望使用并训练这些模型、从而实现极高性能跨任务

2018-08-13 09:33:30

人工智能AI-卷积神经网络LabVIEW之Yolov3+tensorflow深度学习有用吗？

电气工程师利用labview进行深度学习应用编程；3、适用于机械工程师利用labview进行深度学习应用编程；4、适用于在校大学生/研究生利用labview实现课程设计和课题研究；5、适用于IT互联网

2020-11-27 11:19:37

什么是深度学习？

深度学习是什么意思

2020-11-11 06:58:03

什么是深度学习？使用FPGA进行深度学习的好处？

上述分类之外，还被用于多项任务（下面显示了四个示例）。在 FPGA 上进行深度学习的好处我们已经提到，许多服务和技术都使用深度学习，而 GPU 大量用于这些计算。这是因为矩阵乘法作为深度学习中的主要

2023-02-17 16:56:59

免费视频教程：java经典面试题深度解析

2017-06-19 14:14:44

免费视频教程：java经典面试题深度解析

对于很多初学者来说，学好java在后期面试的阶段都没什么经验，为了让大家更好的了解面试相关知识，今天在这里给大家分享了一个java经典面试题深度解析的免费视频教程，需要的朋友可以看看，作为参考！课程

2017-06-15 15:13:17

功能安全---AUTOSAR架构深度解析精选资料分享

AUTOSAR架构深度解析本文转载于：AUTOSAR架构深度解析AUTOSAR的分层式设计，用于支持完整的软件和硬件模块的独立性(Independence)，中间RTE(Runtime

2021-07-23 08:34:18

基于深度学习技术的智能机器人

——工业机器人的智能化程度要求也越来越高，采用深度学习技术为工业机器人赋能是目前各大厂商的统一认知。本文结合实际案例，简要说明一下智能机器人的实现流程。一、智能机器人概念人工智能技术，其主要作用就是用

2018-05-31 09:36:03

基于深度学习的异常检测的研究方法

ABSTRACT1.基于深度学习的异常检测的研究方法进行结构化和全面的概述2.回顾这些方法在各个领域这个中的应用情况，并评估他们的有效性。3.根据基本假设和采用的方法将最先进的深度异常检测技术分为

2021-07-12 06:36:22

基于深度学习的异常检测的研究方法

异常检测的深度学习研究综述原文：arXiv:1901.03407摘要异常检测是一个重要的问题，在不同的研究领域和应用领域都得到了很好的研究。本文的研究目的有两个：首先，我们对基于深度学习的异常检测

2021-07-12 07:10:19

射频系统的深度学习【回映分享】

本文由回映电子整理分享，欢迎工程老狮们参与学习与评论内容► 射频系统中的深度学习► Deepwave Digital技术► 信号检测和分类示例► GPU的实时DSP基准测试► 总结回映电子是一家

2022-01-05 10:00:58

异常检测的深度学习：一项调查（翻译）精选资料分享

摘要异常检测是一个重要的问题，在不同的研究领域和应用领域都得到了充分的研究。本调查的目的有两个方面，首先我们对基于深度学习的异常检测的研究方法进行了结构化和全面的概述。此外，我们回顾了这些方法在

2021-07-12 08:05:13

机器学习简介与经典机器学习算法人才培养

与基于CNN的网络进行迁移性能的对比。培训专家培训专家来自中国科学院计算技术研究所、清华大学、北京理工大学等科研机构和大学的高级专家，拥有丰富的科研及工程技术经验，长期从事人工智能芯片、FPGA、深度学习等领域的教学与研究工作。审核编辑：符乾江

2022-04-28 18:56:07

浅谈深度学习之TensorFlow

神经网络和深度学习的概念，但为了完整起见，我们将在这里介绍基础知识，并探讨 TensorFlow 的哪些特性使其成为深度学习的热门选择。神经网络是一个生物启发式的计算和学习模型。像生物神经元一样，它们从其他

2020-07-28 14:34:04

深入解析传感器网络中实时通信的研究

2021-05-26 06:00:09

百度深度学习研究院科学家深度讲解人工智能

的研发经验。在过去的工作中，他发表过论文十余篇，申请中国专利超过100项，其中已经授权的有95项。他曾任职百度深度学习研究院，负责人脸识别方向，曾经多次带领团队在主流的人脸检测、人脸识别竞赛上取得

2018-07-19 10:01:11

视频教程：Java常见面试题目深度解析！

视频教程：Java常见面试题目深度解析！Java作为目前比较火的计算机语言之一，连续几年蝉联最受程序员欢迎的计算机语言榜首，因此每年新入职Java程序员也数不胜数。很多java程序员在学成之后，会面

2017-07-11 10:55:04

计算机视觉应用深度学习

怎样从传统机器学习方法过渡到深度学习？

2021-10-14 06:51:23

请问一下什么是深度学习？

2021-08-30 07:35:21

深度学习在图像超清化的应用

深度学习的出现使得算法对图像的语义级操作成为可能。本文即是介绍深度学习技术在图像超清化问题上的最新研究进展。深度学习最早兴起于图像，其主要处理图像的技术是卷积神经网络，关于卷积神经网络的起源，业界

2017-09-30 11:15:17

深度学习应用入门

深度学习技术这一轮AI的技术突破，主要源于深度学习技术，而关于AI和深度学习的发展历史我们这里不重复讲述，可自行查阅。我用了一个多月的业务时间，去了解和学习了深度学习技术，在这里，我尝试以一名业务

2017-09-30 14:35:19

诺亚关于深度学习的研究进展及发展趋势

本文来自华为诺亚方舟实验室资深专家刘晓华在携程技术中心主办的深度学习Meetup中的主题演讲，介绍了华为诺亚面向语音语义的深度学习进展。本次演讲简要回顾了深度学习近十年进展，重点介绍华为诺亚方舟

2017-10-09 18:36:54

开源深度学习框架对比研究的三个主要维度学习

本节对5个开源深度学习框架进行对比研究，主要侧重于3个维度研究：硬件支持率、速度和准确率、社区活跃性。他们分别是：TensorFlow、Caffe、Keras、Torch、DL4j 。 2.3.1

2017-11-15 12:04:00

3896

将深度学习和强化学习相结合的深度强化学习DRL

深度强化学习DRL自提出以来，已在理论和应用方面均取得了显著的成果。尤其是谷歌DeepMind团队基于深度强化学习DRL研发的AlphaGo，将深度强化学习DRL成推上新的热点和高度，成为人工智能历史上一个新的里程碑。因此，深度强化学习DRL非常值得研究。

2018-06-29 18:36:00

27596

深度学习框架Keras代码解析

总体来讲keras这个深度学习框架真的很“简易”，它体现在可参考的文档写的比较详细，不像caffe，装完以后都得靠技术博客，keras有它自己的官方文档（不过是英文的），这给初学者提供了很大的学习空间。

2017-12-15 08:22:04

4391

开源神经网络图片上色技术解析解密深度学习自动上色

如何利用深度神经网络给图片自动上色，本文介绍了开源神经网络图片上色技术，解析深度学习会自动上色的核心技术，并且几秒钟就实现PS几个月的效果

2018-01-10 13:21:52

11397

一图深度解析IoT领域4大“战役”

深度解析IoT领域4大“战役”

2018-01-22 10:25:31

4556

模型驱动深度学习的标准流程与学习方法解析

模型驱动的深度学习方法近年来，深度学习在人工智能领域一系列困难问题上取得了突破性成功应用。

2018-01-24 11:30:13

4608

袁进辉：分享了深度学习框架方面的技术进展

1月17日，院友袁进辉博士回到微软亚洲研究院做了题为《打造最强深度学习引擎》的报告，分享了深度学习框架方面的技术进展。

2018-01-25 09:23:45

4492

NVIDIA全新GPU加速的深度学习技术

与NIPS展示的研究类似，多模态图像转换依赖于无监督式学习和生成式对抗网络 (GAN) 这两项深度学习技术，赋予设备更多“想象力”，例如“想象”一条阳光普照的街道在暴风雨或冬季时的景象。

2018-04-27 11:12:59

4423

探讨深度学习在自动驾驶中的应用

深度强化学习的理论、自动驾驶技术的现状以及问题、深度强化学习在自动驾驶技术当中的应用及基于深度强化学习的礼让自动驾驶研究。

2018-08-18 10:19:57

4854

深度学习是什么？了解深度学习难吗?让你快速了解深度学习的视频讲解

本深度学习是什么？了解深度学习难吗?让你快速了解深度学习的视频讲解本文档视频让你4分钟快速了解深度学习深度学习的概念源于人工智能的人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

2018-08-23 14:36:16

一文解读深度学习的发展

在2018清洁发展国际融资论坛上，北京交通大学人工智能研究院常务副院长、教授于剑先生从专业角度回顾了人工智能的发展历程，并介绍了深度学习的适用范围和所面临的问题。他指出，深度学习是机器学习领域最引人注目的研究方向，但没有任何一种算法可以解决机器学习所有的应用。

2018-10-05 17:29:00

2098

浅论学习深度学习的四个步骤

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

2018-10-07 15:19:00

11904

深度学习真的好吗

对深度学习近期取得的进展，从事图像处理研究的人可谓厌恶和妒忌参半。

2019-07-03 10:43:37

4879

AI和深度学习存储的重要性解析

很多研究人员已经证明，深度学习模型的准确性会随着数据集的增加而提高。这种准确性的提高非常重要，以至于研究人员经常会使用复杂的数据增强技术来综合地生成额外数据用于训练模型。

2019-09-28 06:54:00

1435

人工智能之深度强化学习DRL的解析

深度学习DL是机器学习中一种基于对数据进行表征学习的方法。深度学习DL有监督和非监督之分，都已经得到广泛的研究和应用。

2020-01-24 10:46:00

4734

Facebook研究开放新框架，让深度学习更加容易

FAIR一直是深度学习领域研究和开源框架的定期贡献者。从PyTorch到ONNX, FAIR团队为实现深度学习应用程序的简化做出了不可思议的贡献。

2020-03-13 15:23:05

1503

一个全新的深度学习框架——计图

清华大学计算机系胡事民教授研究团队提出了一个全新的深度学习框架——计图（Jittor）。Jittor是一个采用元算子表达神经网络计算单元、完全基于动态编译（Just-in-Time）的深度学习框架。

2020-03-26 15:50:29

6456

AI 深度学习机器学习和NLP四种先进技术的不同

随着人类技术的不断发展，人工智能，深度学习，机器学习和NLP都是受欢迎的搜索热词。

2020-05-03 18:09:00

2435

如何使用深度学习实现语音声学模型的研究

的分析识别更是研究的重中之重。近年来深 10 度学习模型的广泛发展和计算能力的大幅提升对语音识别技术的提升起到了关键作用。本文立足于语音识别与深度学习理论紧密结合，针对如何利用深度学习模型搭建区分能力更强鲁棒性更

2020-05-09 08:00:00

（KAIST）研究人员提供了一种深度学习供电的单应变电子皮肤传感器

传感器应用韩国科学技术高等研究院（KAIST）研究人员提供了一种深度学习供电的单应变电子皮肤传感器，可以从远处捕获人体运动。韩国科学技术高等研究院（KAIST）研究人员提供了一种深度学习供电

2020-09-22 14:28:31

1814

什么是深度学习，深度学习能解决什么问题

深度学习是机器学习与神经网络、人工智能、图形化建模、优化、模式识别和信号处理等技术融合后产生的一个领域。

2020-11-05 09:31:19

4711

深度主动学习的相关工作全面概述

Abstract 主动学习试图通过标记最少量的样本使得模型的性能收益最大化。而深度学习则对数据比较贪婪，需要大量的数据供给来优化海量的参数，从而使得模型学会如何提取高质量的特征。近年来，由于互联网技术

2021-02-17 11:55:00

3128

机器学习和深度学习有什么区别？

觉信息的理解可以被再现甚至超越。借助深度学习，作为机器学习的一部分，可以在应用实例的基础上学习和训练复杂的关系。机器学习中的另一种技术是例如“超级矢量机”。与深度学习相比，必须手动定义和验证功能。在深度学习中

2021-03-12 16:11:00

7763

基于深度学习的三维点云语义分割研究分析

近年来，深度传感器和三维激光扫描仪的普及推动了三维点云处理方法的快速发展。点云语义分割作为理解三维场景的关键步骤，受到了研究者的广泛关注。随着深度学习的迅速发展并广泛应用到三维语义分割领域，点云语义

2021-04-01 14:48:46

基于深度学习的恶意代码功防研究及进展

深度学习赋能的恶意代码攻防研究已经成为网络安全领域中的热点问题。当前还没有针对这一热点问题的相关综述，为了及时跟进该领域的最新研究成果，本文首先分析并总结了恶意代码攻击的一般流程。基于该攻击流程

2021-04-28 17:23:38

深度学习为传统视觉检测带来希望

　　深度学习（Deep Learning）的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。它是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络

2021-06-17 10:32:02

438

基于深度学习的文本主题模型研究综述

2021-06-24 11:49:18

基于深度学习的道路表面裂缝检测技术

2021-07-05 16:30:30

HarmonyOS测试技术与实战-HarmonyOS图形栈测试技术深度解析

HDC 2021华为开发者大会HarmonyOS测试技术与实战-HarmonyOS图形栈测试技术深度解析

2021-10-23 15:09:00

1256

深度学习在轨迹数据挖掘中的应用研究综述

深度学习在轨迹数据挖掘中的应用研究综述来源：《计算机科学与应用》，作者李旭娟等摘要: 在过去十年，深度学习已被证明在很多领域应用非常成功，如视觉图像、自然语言处理、语音识别等，同时

2022-03-08 17:24:10

1271

深度学习基础知识分享

深度学习也为其他科学做出了贡献。用于对象识别的现代卷积网络为神经科学家们提供了可以研究的视觉处理模型（DiCarlo,2013）。深度学习也为处理海量数据以及在科学领域作出有效的预测提供了非常

2022-09-05 10:30:12

使用深度学习的在线学习中的错误发音检测

　　以正确的方式发音是最难获得的技能之一，全球的研究人员正专注于使用机器/深度学习技术检测发音错误。在线学习中错误发音检测的目的是高精度地识别发音错误或缺陷，并提供指导性反馈以改善发音。

2022-11-29 12:10:26

526

百度王海峰：深度学习平台+大模型，产业智能化基座

11月30日，由深度学习技术及应用国家工程研究中心主办的Wave Summit+ 2022深度学习开发者峰会如期举行。鹏城实验室主任、中国工程院高文院士，深圳大学电子与信息工程学院院长、深度学习技术

2022-12-01 18:03:32

816

读懂深度学习，走进“深度学习+”阶段

人工智能的概念在1956年就被提出，如今终于走入现实，离不开一种名为“深度学习”的技术。深度学习的运作模式，如同一场传话游戏。给神经网络输入数据，对数据的特征进行描述，在神经网络中层层传递，最终

2023-01-14 23:34:43

588

基于深度学习的散射成像研究进展

卷积神经网络（CNN）是一种用于对目标进行重建、分类等处理的深度学习方法。自2016年深度学习被首次应用于散射成像，该研究一直是光学成像领域的热门方向。

2023-05-24 09:51:21

166

深度解析可扩展且保密的深度学习

可扩展且保密的深度学习

2023-06-28 16:09:14

195

深度学习算法简介深度学习算法是什么深度学习算法有哪些

深度学习算法简介深度学习算法是什么?深度学习算法有哪些? 作为一种现代化、前沿化的技术，深度学习已经在很多领域得到了广泛的应用，其能够不断地从数据中提取最基本的特征，从而对大量的信息进行机器学习

2023-08-17 16:02:56

6010

深度学习是什么领域

深度学习是什么领域深度学习是机器学习的一种子集，由多层神经网络组成。它是一种自动学习技术，可以从数据中学习高层次的抽象模型，以进行推断和预测。深度学习广泛应用于计算机视觉、语音识别、自然语言处理

2023-08-17 16:02:59

995

什么是深度学习算法？深度学习算法的应用

什么是深度学习算法？深度学习算法的应用深度学习算法被认为是人工智能的核心，它是一种模仿人类大脑神经元的计算模型。深度学习是机器学习的一种变体，主要通过变换各种架构来对大量数据进行学习以及分类处理

2023-08-17 16:03:04

1305

深度学习框架是什么？深度学习框架有哪些？

高模型的精度和性能。随着人工智能和机器学习的迅猛发展，深度学习框架已成为了研究和开发人员们必备的工具之一。目前，市场上存在许多深度学习框架可供选择。本文将为您介绍一些较为常见的深度学习框架，并探究它们的特点

2023-08-17 16:03:09

1589

深度学习框架的作用是什么

深度学习框架的作用是什么深度学习是一种计算机技术，它利用人工神经网络来模拟人类的学习过程。由于其高度的精确性和精度，深度学习已成为现代计算机科学领域的重要工具。然而，要在深度学习中实现高度复杂

2023-08-17 16:10:57

1072

深度学习框架对照表

深度学习框架对照表随着人工智能技术的发展，深度学习正在成为当今最热门的研究领域之一。而深度学习框架作为执行深度学习算法的最重要的工具之一，也随着深度学习的发展而越来越成熟。本文将介绍一些常见

2023-08-17 16:11:13

458

深度学习框架连接技术

深度学习框架连接技术深度学习框架是一个能够帮助机器学习和人工智能开发人员轻松进行模型训练、优化及评估的软件库。深度学习框架连接技术则是需要使用深度学习模型的应用程序必不可少的技术，通过连接技术

2023-08-17 16:11:16

443

深度学习框架和深度学习算法教程

深度学习框架和深度学习算法教程深度学习是机器学习领域中的一个重要分支，多年来深度学习一直在各个领域的应用中发挥着极其重要的作用，成为了人工智能技术的重要组成部分。许多深度学习算法和框架提供

2023-08-17 16:11:26

638

机器学习和深度学习的区别

机器学习和深度学习的区别随着人工智能技术的不断发展，机器学习和深度学习已经成为大家熟知的两个术语。虽然它们都属于人工智能技术的研究领域，但它们之间有很大的差异。本文将详细介绍机器学习和深度学习

2023-08-17 16:11:40

2734

深度学习在语音识别中的应用及挑战

一、引言随着深度学习技术的快速发展，其在语音识别领域的应用也日益广泛。深度学习技术可以有效地提高语音识别的精度和效率，并且被广泛应用于各种应用场景。本文将探讨深度学习在语音识别中的应用及所面临

2023-10-10 18:14:53

449

深度学习技术与边缘学习技术的不同之处

如今，AI技术的广泛应用已经成为推动制造和物流领域自动化的核心驱动力。康耐视所推出的深度学习和边缘学习技术，这两种基于AI的技术，在工业自动化领域有着广泛的应用前景。然而，由于这两种技术在研发

2023-11-17 10:44:29

242

已全部加载完成

搜索历史

深度学习研究之PEFT技术解析

评论