深度学习解决方案的构建方式及应用-电子发烧友网

摘要：英特尔人工智能产品事业部，数据科学主任Yinyin Liu近日撰写了一篇文章，介绍了深度学习为自然语言处理带来的种种变化。有趣的大趋势是首先产生在CV领域的技术也不断用于NLP，而深度学习解决方案的构建方式也随着时间在进化。

自然语言处理（NLP）是最常见的人工智能的应用方式之一，它通过消费者数字助理、聊天机器人以及财务和法律记录的文本分析等商业应用变得无处不在。随着硬件和软件能力的提升，以及模块化NLP组件的发展，Intel 的技术也使得各种各样的 NLP 应用成为可能。

深度学习性能的上升趋势

近年来，许多 NLP 领域的进展都是由深度学习领域的普遍进步驱动的。深度学习拥有了更强大的计算资源，可以运用更大的数据集，并且在神经网络拓扑结构和训练范式方面有所发展。这些深度学习的进步始于推动计算机视觉应用的改进，但是也让自然语言处理领域极大地获益。

在深度学习的网络层方面，为了使得信号和梯度能够更容易地传递到深度神经网络的每一层，残差结构单元（residual layer）、highway 层（全连接的 highway 网络）以及稠密连接（dense connections）结构应运而生。有了这些网络层，目前最先进的计算机视觉技术通过利用深度学习网络的表示能力得以实现。同时，他们也在许多自然语言处理任务上提高了模型的性能。例如，将稠密连接的循环层用于语言模型（Improving Language Modeling using Densely Connected Recurrent Neural Networks，https://arxiv.org/abs/1707.06130 ）。

有实证研究中比较了卷积层、循环层或者一种结合了这两种思想的时序卷积层的表现，时序卷积层在一系列的语言数据集上取得了目前最好的效果（Convolutional Sequence to Sequence Learning，https://arxiv.org/abs/1705.03122；An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling，https://arxiv.org/abs/1803.01271）。有这些不同类型的层可供灵活使用，使得开发者能够在处理特定的自然语言处理问题时尝试各种各样的选项。

在深度学习的拓扑结构方面，一个自编码器（auto-encoder）模型可以被改进为一个序列到序列（seq2seq）模型用于处理顺序语言数据。注意力机制（attention mechanism）解决了随着时间的推移，解码网络应该如何对输入的编码做出响应。指针网络（Pointer network），作为注意力模型的一种变体，专门用于在输入序列中寻找词语的位置，它为机器阅读理解和文本摘要提供了一种新的处理机制（Machine Comprehension Using Match-LSTM and Answer Pointer，https://arxiv.org/abs/1608.07905；Get To The Point: Summarization with Pointer-Generator Networks，https://arxiv.org/abs/1704.04368）。通过增加快速权重（fast weights），（Fast Weights to Attend to the Recent Past，https://arxiv.org/abs/1610.06258）短期联想记忆的概念可以和长期序列的学习结合到一起。

在训练范式方面，无监督学习利用训练数据本身和迁移学习技术去构建数据表示，迁移学习可以把学到的将表征用于一个又一个的任务，都是从计算机视觉领域获得启发，推动了自然语言处理技术的进步。

由于这些深度学习模型共用了许多底层的组件，基于深度学习的自然语言处理解决方案可以与计算机视觉和其它人工智能功能的解决方案共用软件和硬件。对于深度学习的通用软件栈的优化也可以为深度学习自然语言处理解决方案的性能带来改善。英特尔的人工智能硬件和软件组合解决方案为这些在英特尔架构的系统上运行的深度学习进展提供了很好的示例。最近，在我们的硬件和对广泛使用的深度学习框架的优化上的工作提供了为在英特尔至强可扩展处理器上运行普遍使用的模型和计算任务优化后的工作性能。英特尔也积极地将他们的这些努力回馈到开放的框架中，这样一来，每个开发者都能很直接地获得这些经验。

为自然语言处理用例构建一个灵活的、模块化的栈

由于基于深度学习的自然语言处理模型通常拥有共用的构建模块（例如：深度学习网络层和深度学习拓扑结构），这让我们在构建自然语言处理用例的基础时拥有了一个全新的视角。一些底层的功能在很多种应用中同时被需要。在一个开放的、灵活的栈中获得基本组件对于解决各种各样的自然语言处理问题是十分恰当的。

相比之下，传统的机器学习或者深度学习的做法都是每一次只考虑某一个特定问题。而如今，由于深度学习社区已经提供了许多有用的基础功能模块，企业中的用户和数据科学家们就可以考虑其它的方面，在学习、构建起基础以后，着眼于如何把它们应用于各种不同的问题。

这种转换的好处主要有这么几点。首先，这些可以复用的组件可以帮助我们逐步构建「结构性资产」。通过重复应用之前已经构建好的东西，我们可以做得更快、评价得更快。其次，这些构建在英特尔的统一软硬件平台上的功能和解决方案可以持续不断地从英特尔未来的开发和改进中受益。另外，用现有的基础设施做实验可以拓展出令人惊喜的新的解决方案或者新的应用，这是更早时候的仅关注于问题本身的思考方式所无法带来的。

一个灵活的、模块化的栈还能使用户可以将传统的自然语言处理方法和基于深度学习的方法结合起来，并为不同的用户群提供不同层次的抽象。许多不同的企业用例表明了自然语言处理和它的基本组件的潜力。下面，我们为您提供了几个例子，但是显然还有很多别的可能性。

主题分析

金融业面临着巨大的知识管理挑战，这是由每天必须处理和理解的文件的数量（太大）所造成的。从一页又一页的文本中提取出诸如「某种特定产品的竞争力」这样的关键的见解是十分困难的。

自然语言处理主题分析技术现在可以被用来快速分析大量的文档，并且识别文档中不同的部分所关联的主题。不同的用户会关注不同的话题，例如：某个公司的价值、竞争力、领导力或者宏观经济学。自然语言处理主题分析让用户能够筛选出特定的感兴趣的主题，并且获得更加浓缩的信息。

为了利用大量未标记的数据，模型可以用内容类似的文本进行预训练，之后这些数据表示可以被迁移至主题分析或者其它附加的任务中。早前的一篇博客介绍了这种解决方案中涉及到的一些方法的概述。为了实现这种方案，从自然语言处理构建模块的角度来说，我们使用了序列到序列（seq2seq）的拓扑结构，长短期记忆网络（LSTM），词嵌入来自迁移学习，而后进行精细调节（fine-tune），还可以与命名实体识别等组件结合在一起。

趋势分析

诸如医疗保健、工业制造、金融业等行业都面临着从大量的文本数据中识别基于时间的趋势的挑战。通过将文本正则化、名词短语分块和抽取、语言模型、语料库的词频-逆文本频率指数（TF-IDF）算法，以及使用词向量的分组等技术，我们可以快速的生成一个解决方案，它可以从一组文档中抽取关键词和重要性估计。接着，随着时间的推移，通过比较这些抽取出来的关键词，我们能够发现有用的趋势，例如：天气变化如何能够造成库存的短缺，或者哪些领域的学术研究随着时间的推移会吸引更多的贡献和注意。

情感分析

情感分析功能通常被用于竞争力分析、沟通策略优化、以及产品或市场分析。一个提供了细粒度的情感分析的解决方案能够为企业用户提供可行的见解。例如：这种更有针对性的情感分析可以发现，关于一个特定商品的评论普遍是对于它的能耗的正面看法以及对它的可靠性的负面看法。对于这种细粒度的情感分析，我们使用了诸如词性标注（POS tagging）、文本正则化、依存分析和词汇扩展等组件。对于不同的领域，相同的的那次可能传递不同的情感，所以允许领域自适应的机制也是十分关键的。

多功能体系架构上灵活的构造模块

当我们看到巨大的自然语言处理市场中的种种规划时，我们应该如何构建解决方案、软件、硬件来利用这些机会并使它们成为可能？在英特尔，我们希望构建能够持续创新和改进的技术，这能够给我们一个用于研究、实践并应用算法的开放的、灵活的平台，这种技术还能够高效地扩展到多种应用程序中，最终形成影响深远的商业见解。

在英特尔人工智能实验室，我们的自然语言处理研究人员和开发者正在构建一个开放的、灵活的自然语言处理组件库，以便为我们的合作伙伴和客户实现多种自然语言处理用例。它使我们能够高效地将我们灵活、可靠高性能的英特尔架构为这些自然语言处理应用、其他的人工智能和先进分析工作流提供了硬件、框架工具和软件层。我们将继续努力优化这些组件，以提高深度学习的能力。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英特尔

英特尔

+关注

关注
61

文章
9949

浏览量
171694
机器视觉

机器视觉

+关注

关注
161

文章
4369

浏览量
120282
深度学习

深度学习

+关注

关注
73

文章
5500

浏览量
121113

原文标题：NLP 解决方案是如何被深度学习改写的？

文章出处：【微信号：AItists，微信公众号：人工智能学家】欢迎添加关注！文章转载请注明出处。

NPU在深度学习中的应用

随着人工智能技术的飞速发展，深度学习作为其核心驱动力之一，已经在众多领域展现出了巨大的潜力和价值。NPU（Neural Processing Unit，神经网络处理单元）是专门为深度学习

发表于 11-14 15:17 •510次阅读

Pytorch深度学习训练的方法

掌握这 17 种方法，用最省力的方式，加速你的 Pytorch 深度学习训练。

发表于 10-28 14:05 •195次阅读

GPU深度学习应用案例

GPU在深度学习中的应用广泛且重要，以下是一些GPU深度学习应用案例：一、图像识别图像识别是深度学习

发表于 10-27 11:13 •382次阅读

AI大模型与深度学习的关系

AI大模型与深度学习之间存在着密不可分的关系，它们互为促进，相辅相成。以下是对两者关系的介绍：一、深度学习是AI大模型的基础技术支撑：深度

发表于 10-23 15:25 •651次阅读

FPGA做深度学习能走多远？

支持不同的数据精度、量化和激活函数等。这种灵活性使其能够适应各种深度学习任务，为不同的应用场景提供定制化的解决方案。 • 低功耗：FPGA 是可编程的，可以在设计中仅使用所需的计算资源，从而避免不必要

发表于 09-27 20:53

深度学习中的时间序列分类方法

时间序列分类（Time Series Classification, TSC）是机器学习和深度学习领域的重要任务之一，广泛应用于人体活动识别、系统监测、金融预测、医疗诊断等多个领域。随着深度

发表于 07-09 15:54 •877次阅读

基于AI深度学习的缺陷检测系统

在工业生产中，缺陷检测是确保产品质量的关键环节。传统的人工检测方法不仅效率低下，且易受人为因素影响，导致误检和漏检问题频发。随着人工智能技术的飞速发展，特别是深度学习技术的崛起，基于AI深度学

发表于 07-08 10:30 •1364次阅读

深度学习在视觉检测中的应用

深度学习是机器学习领域中的一个重要分支，其核心在于通过构建具有多层次的神经网络模型，使计算机能够从大量数据中自动学习并提取特征，进而实现对复

发表于 07-08 10:27 •700次阅读

深度学习与nlp的区别在哪

方法，它通过模拟人脑的神经网络结构，实现对数据的自动特征提取和学习。深度学习的核心是构建多层的神经网络结构，每一层都包含大量的神经元，这些神经元通过权重连接，实现对输入数据的逐层抽象和

发表于 07-05 09:47 •909次阅读

深度学习与卷积神经网络的应用

到自然语言处理，深度学习和CNN正逐步改变着我们的生活方式。本文将深入探讨深度学习与卷积神经网络的基本概念、工作原理及其在多个领域的应用，并

发表于 07-02 18:19 •886次阅读

TensorFlow与PyTorch深度学习框架的比较与选择

深度学习作为人工智能领域的一个重要分支，在过去十年中取得了显著的进展。在构建和训练深度学习模型的过程中，

发表于 07-02 14:04 •953次阅读

深度学习模型训练过程详解

详细介绍深度学习模型训练的全过程，包括数据预处理、模型构建、损失函数定义、优化算法选择、训练过程以及模型的评估与调优。

发表于 07-01 16:13 •1235次阅读

深度学习与传统机器学习的对比

在人工智能的浪潮中，机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步，为众多领域带来了革命性的变化。然而，尽管它们都属于机器

发表于 07-01 11:40 •1326次阅读

深度解析深度学习下的语义SLAM

随着深度学习技术的兴起，计算机视觉的许多传统领域都取得了突破性进展，例如目标的检测、识别和分类等领域。近年来，研究人员开始在视觉SLAM算法中引入深度学习技术，使得

发表于 04-23 17:18 •1286次阅读

交换芯片的构建方式

交换芯片的构建方式是一个高度复杂且精细的过程，它涉及多个关键步骤和考量因素。下面将详细阐述交换芯片的构建方式。

发表于 03-22 16:22 •466次阅读

搜索历史

深度学习解决方案的构建方式及应用

深度学习性能的上升趋势

为自然语言处理用例构建一个灵活的、模块化的栈

多功能体系架构上灵活的构造模块

评论