0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于深度学习用于多模态语义学习的简述

独爱72H 来源:网络整理 作者:佚名 2020-04-15 17:33 次阅读

(文章来源:网络整理)

互联网用户所创造的“内容”正在迅猛增长,从不同渠道涌现的文本、图像和视频等不同类型的媒体数据以及用户信息更加紧密混合。它们正在以一种新的形式,更为形象综合地表达语义、主题和事件。针对当前媒体数据呈现出的特点进行深入研究已成为学术热点,多种类型媒体数据依赖共存,各种平台和应用的数据来源广泛,个体和群体参与数据产生的用户交互史无前例。

谷歌的前任研究主管皮特·诺文(Perter Norvig)博士曾在2010年《自然》杂志上发表文章《2020愿景》,指出今后10年,文本、图像、视频等数据以及用户交互信息和各种传感器信息将混合在一起,从搜索角度看,搜索引擎对检索结果进行的是内容综合而非数据罗列,这也将是谷歌今后面临的巨大挑战。我国也同样重视“跨媒体”研究,国家科技部于2011年11月启动了973计划项目“面向公共安全的跨媒体计算理论与方法”,对“跨媒体”的表达建模、语义学习、挖掘推理和搜索排序等核心问题开展了理论研究。目前,媒体计算需要重点解决的两个难点是消除“异构鸿沟”和“语义鸿沟。

传统的媒体计算研究方法主要从手工构建的底层特征出发,利用机器学习方法填补异构鸿沟和语义鸿沟。与传统方法不同深度学习是通过将无监督逐层预训练与有监督微调(fine-tuning)有机结合,实现端到端方式的特征学习。其基本动机是构建多层网络来学习隐含在数据内部的关系,从而使学习得到的特征具有更强的表达力和泛化能力。

在大规模数据上进行的实验表明:通过深度学习得到的特征表示在自然语言处理(词向量学习)、知识图谱构建、图像分类和语音识别等领域表现出良好的性能。例如谷歌研究组在2014年大规模视觉识别挑战赛中采用改进的卷积神经网络GoogLeNet,将图像识别准确率提升到93.3%。

通常,在媒体语义理解过程中可获取不同类型的媒体数据,如:新闻报道包含了文字和文字对应的图像,视频包含了视觉和听觉信息。不同类型的媒体数据从不同侧面反映了高层语义,因此多模态语义学习需要对不同模态的信息进行整合。1976年,麦格克(McGurk)等人验证了人类对外界信息的认知是基于不同感官信息而形成的整体性理解,任何感官信息的缺乏或不准确,都将导致大脑对外界信息的理解产生偏差,这个现象被称为“McGurk现象”。McGurk现象揭示了大脑在进行感知时,不同感官会被无意识地自动结合在一起对信息进行处理。

由于深度学习具有通过逐层抽象来形成良好特征的能力,因此可利用该方法来形成不同类型数据的联合特征表示。具体方法有深度典范相关分析(Deep Caconical Correlation Analysis,Deep CCA)、多模态深度学习以及多模态玻尔兹曼机等。这些方法的基本思路是通过不同的深层模型对不同类型数据进行逐层学习,将学习得到的结果进行合并,以得到多模态联合特征表示,最后要求多模态联合特征能有效重建原始不同类型数据或表达相关语义概念。为了得到更好的深层模型,一般在深层模型的最顶端设计反映不同类型数据相互耦合的损失函数来对模型进行优化反馈。

将深度学习应用于语义概念识别和理解时,有两种方法:(1)将深度学习得到的特征表示直接输入给判别分类模型(如支持向量机等);(2)通过softmax函数或回归函数对输人数据、隐含层和输出层(语义标签)之间的概率分布进行建模,然后基于互信息熵最小或间隔距离最大等准则对模型进行优化。

有人的理论研究结果表明:在机器学习中,如果对模型本身的假设产生偏差,则会影响学习结果。因此,如何合理引入数据本身所具有的先验知识和结构线索,来构造和微调深层模型使之更好地处理多模态数据,是一个亟待解决的问题。因此,一些研究开始在生成式深层模型或区别式深层模型中引入数据本身所具有的先验结构,以提升特征学习的泛化能力和区别能力。有人在卷积神经网络输出端引入层次化概念树来促进关联语义所具有的共享特征的学习,有人通过非参贝叶斯假设来提高判别性语义特征学习的灵活度。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    10965

    浏览量

    101563
  • 深度学习
    +关注

    关注

    73

    文章

    5312

    浏览量

    120179
收藏 人收藏

    评论

    相关推荐

    深度解析深度学习下的语义SLAM

    随着深度学习技术的兴起,计算机视觉的许多传统领域都取得了突破性进展,例如目标的检测、识别和分类等领域。近年来,研究人员开始在视觉SLAM算法中引入深度学习技术,使得
    发表于 04-23 17:18 391次阅读
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>学习</b>下的<b class='flag-5'>语义</b>SLAM

    三星正考虑为Bixby添加生成式AI功能

    Choi强调:“鉴于新型生成式AI与大语义学习(LLM)技术的出现,我们有必要去重新定位Bixby搭载这类科技以实现智能升级。
    的头像 发表于 04-01 15:01 351次阅读

    深度学习在语音识别中的应用及挑战

    一、引言 随着深度学习技术的快速发展,其在语音识别领域的应用也日益广泛。深度学习技术可以有效地提高语音识别的精度和效率,并且被广泛应用于各种
    的头像 发表于 10-10 18:14 623次阅读

    深度学习图像语义分割指标介绍

    深度学习在图像语义分割上已经取得了重大进展与明显的效果,产生了很多专注于图像语义分割的模型与基准数据集,这些基准数据集提供了一套统一的批判模型的标准,多数时候我们评价一个模型的性能会从
    发表于 10-09 15:26 240次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>图像<b class='flag-5'>语义</b>分割指标介绍

    深度学习的由来 深度学习的经典算法有哪些

    深度学习作为机器学习的一个分支,其学习方法可以分为监督学习和无监督学习。两种方法都具有其独特的
    发表于 10-09 10:23 413次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>的由来 <b class='flag-5'>深度</b><b class='flag-5'>学习</b>的经典算法有哪些

    一文详解机器学习深度学习的区别

    深度学习这几年特别火,就像5年前的大数据一样,不过深度学习其主要还是属于机器学习的范畴领域内,所以这篇文章里面我们来唠一唠机器
    发表于 09-06 12:48 1552次阅读
    一文详解机器<b class='flag-5'>学习</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b>的区别

    用于任意数据模态的自监督学习数据增强技术

    本文提出了一种适用于任意数据模态的自监督学习数据增强技术。   自监督学习算法在自然语言处理、计算机视觉等领域取得了重大进展。这些自监督学习
    的头像 发表于 09-04 10:07 865次阅读
    适<b class='flag-5'>用于</b>任意数据<b class='flag-5'>模态</b>的自监督<b class='flag-5'>学习</b>数据增强技术

    机器学习深度学习的区别

    机器学习深度学习的区别 随着人工智能技术的不断发展,机器学习深度学习已经成为大家熟知的两个术
    的头像 发表于 08-17 16:11 3693次阅读

    深度学习服务器怎么做 深度学习服务器diy 深度学习服务器主板用什么

    深度学习服务器怎么做 深度学习服务器diy 深度学习服务器主板用什么  随着人工智能的飞速发展,
    的头像 发表于 08-17 16:11 646次阅读

    深度学习框架和深度学习算法教程

    了基于神经网络的机器学习方法。 深度学习算法可以分为两大类:监督学习和无监督学习。监督学习的基本
    的头像 发表于 08-17 16:11 852次阅读

    深度学习算法库框架学习

    深度学习算法库框架学习 深度学习是一种非常强大的机器学习方法,它可以
    的头像 发表于 08-17 16:11 487次阅读

    深度学习框架是什么?深度学习框架有哪些?

    深度学习框架是什么?深度学习框架有哪些?  深度学习框架是一种软件工具,它可以帮助开发者轻松快速
    的头像 发表于 08-17 16:03 2158次阅读

    什么是深度学习算法?深度学习算法的应用

    什么是深度学习算法?深度学习算法的应用 深度学习算法被认为是人工智能的核心,它是一种模仿人类大脑
    的头像 发表于 08-17 16:03 1676次阅读

    深度学习是什么领域

    深度学习是什么领域  深度学习是机器学习的一种子集,由多层神经网络组成。它是一种自动学习技术,可
    的头像 发表于 08-17 16:02 1574次阅读

    深度学习算法简介 深度学习算法是什么 深度学习算法有哪些

    深度学习算法简介 深度学习算法是什么?深度学习算法有哪些?  作为一种现代化、前沿化的技术,
    的头像 发表于 08-17 16:02 7700次阅读