使用深度学习融合各种来源的信息-电子发烧友网

导读

使用深度学习融合各种来源的信息。

多模态数据

我们对世界的体验是多模态的 —— 我们看到物体，听到声音，感觉到质地，闻到气味，尝到味道。模态是指某件事发生或经历的方式，当一个研究问题包含多个模态时，它就具有多模态的特征。为了让人工智能在理解我们周围的世界方面取得进展，它需要能够同时解释这些多模态的信号。

例如，图像通常与标签和文本解释相关联，文本包含图像，以更清楚地表达文章的中心思想。不同的模态具有非常不同的统计特性。

多模态深度学习

虽然结合不同的模态或信息类型来提高效果从直观上看是一项很有吸引力的任务，但在实践中，如何结合不同的噪声水平和模态之间的冲突是一个挑战。此外，模型对预测结果有不同的定量影响。在实践中最常见的方法是将不同输入的高级嵌入连接起来，然后应用softmax。

多模态深度学习的例子，其中使用不同类型的神经网络提取特征

这种方法的问题是，它将给予所有子网络/模式同等的重要性，这在现实情况中是非常不可能的。

所有的模态对预测都有相同的贡献

对网络进行加权组合

我们采用子网络的加权组合，以便每个输入模态可以对输出预测有一个学习贡献(Theta)。我们的优化问题变成-

对每个子网络给出Theta权值后的损失函数。

将权值附加到子网后预测输出。

把所有的都用起来！

准确性和可解释性我们在两个现实多模态数据集上得到了SOTA： Multimodal Corpus of Sentiment Intensity(MOSI) 数据集 —— 有417个标注过的视频，每毫秒标注的音频特征。共有2199个标注数据点，其中情绪强度定义为从strongly negative到strongly positive，线性尺度从- 3到+3。

模态包括：

1. 文本 2. 音频

3. 语言

每种模态对情绪预测的贡献量 Transcription Start Site Prediction(TSS)数据集 —— Transcription是基因表达的第一步，在这一步中，特定的DNA片段被复制到RNA (mRNA)中。Transcription起始位点是transcription开始的位置。DNA片段的不同部分具有不同的特性，从而影响其存在。

我们将TSS分为三个部分：

上游DNA

下游DNA

TSS位置

我们取得了前所未有的改善，比之前的最先进的结果3%。使用TATA box的下游DNA区域对这一过程影响最大。

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
46738

浏览量
237314
数据集

数据集

+关注

关注
4

文章
1205

浏览量
24630
深度学习

深度学习

+关注

关注
73

文章
5485

浏览量
120937

原文标题：多模态深度学习：用深度学习的方式融合各种信息

文章出处：【微信号：Imgtec，微信公众号：Imagination Tech】欢迎添加关注！文章转载请注明出处。

NPU在深度学习中的应用

随着人工智能技术的飞速发展，深度学习作为其核心驱动力之一，已经在众多领域展现出了巨大的潜力和价值。NPU（Neural Processing Unit，神经网络处理单元）是专门为深度学习

发表于 11-14 15:17 •195次阅读

AI干货补给站 | 深度学习与机器视觉的融合探索

，帮助从业者积累行业知识，推动工业视觉应用的快速落地。本期亮点预告本期将以“深度学习与机器视觉的融合探索”为主题，通过讲解深度学习定义、传统

发表于 10-29 08:04 •177次阅读

GPU深度学习应用案例

GPU在深度学习中的应用广泛且重要，以下是一些GPU深度学习应用案例：一、图像识别图像识别是深度学习

发表于 10-27 11:13 •311次阅读

AI大模型与深度学习的关系

AI大模型与深度学习之间存在着密不可分的关系，它们互为促进，相辅相成。以下是对两者关系的介绍：一、深度学习是AI大模型的基础技术支撑：深度

发表于 10-23 15:25 •344次阅读

FPGA做深度学习能走多远？

支持不同的数据精度、量化和激活函数等。这种灵活性使其能够适应各种深度学习任务，为不同的应用场景提供定制化的解决方案。 • 低功耗：FPGA 是可编程的，可以在设计中仅使用所需的计算资源，从而避免不必要

发表于 09-27 20:53

利用Matlab函数实现深度学习算法

在Matlab中实现深度学习算法是一个复杂但强大的过程，可以应用于各种领域，如图像识别、自然语言处理、时间序列预测等。这里，我将概述一个基本的流程，包括环境设置、数据准备、模型设计、训练过程、以及测试和评估，并提供一个基于Mat

发表于 07-14 14:21 •1848次阅读

深度学习中的时间序列分类方法

时间序列分类（Time Series Classification, TSC）是机器学习和深度学习领域的重要任务之一，广泛应用于人体活动识别、系统监测、金融预测、医疗诊断等多个领域。随着深度

发表于 07-09 15:54 •682次阅读

深度学习与nlp的区别在哪

深度学习和自然语言处理（NLP）是计算机科学领域中两个非常重要的研究方向。它们之间既有联系，也有区别。本文将介绍深度学习与NLP的区别。深度

发表于 07-05 09:47 •784次阅读

深度学习的模型优化与调试方法

深度学习模型在训练过程中，往往会遇到各种问题和挑战，如过拟合、欠拟合、梯度消失或爆炸等。因此，对深度学习模型进行优化与调试是确保其性能优越的

发表于 07-01 11:41 •669次阅读

信息化与农业生产的深度融合

信息化与农业生产的深度融合信息化与农业生产的深度融合，是现代农业发展的一个重要趋势，它不仅促进

发表于 06-28 13:58 •275次阅读

基于深度学习的鸟类声音识别系统

具体的软硬件实现点击http://mcu-ai.com/MCU-AI技术网页_MCU-AI 鸟叫声识别在鸟类保护中具有重要意义。通过适当的声音分类，研究可以自动预测该地区的生活质量。如今，深度学习

发表于 05-30 20:30

深度解析深度学习下的语义SLAM

随着深度学习技术的兴起，计算机视觉的许多传统领域都取得了突破性进展，例如目标的检测、识别和分类等领域。近年来，研究人员开始在视觉SLAM算法中引入深度学习技术，使得

发表于 04-23 17:18 •1233次阅读

详解深度学习、神经网络与卷积神经网络的应用

在如今的网络时代，错综复杂的大数据和网络环境，让传统信息处理理论、人工智能与人工神经网络都面临巨大的挑战。近些年，深度学习逐渐走进人们的视线，通过深度

发表于 01-11 10:51 •1872次阅读

深度学习神器DYnet++：轻松驾驭复杂自由曲面，3D测量无难度！

利用深度学习网络模型DYnet++从单个复合图案中获取相位信息。为了训练深度学习模型，作者使用了一个具有九个致动器的可变形镜来生成

发表于 12-04 15:29 •591次阅读

深度学习在人工智能中的 8 种常见应用

，彻底改变了人工智能。人脑的结构和操作启发了这些算法。你觉得怎么样？人工智能（AI）中有哪些典型的深度学习应用？深度学习经常用于各种人工智能

发表于 12-01 08:27 •3215次阅读