0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微美全息(NASDAQ:WIMI)探索全局-局部特征自适应融合网络框架在图像场景分类中的创新运用

科技讯息 来源:科技讯息 作者:科技讯息 2024-01-05 16:08 次阅读

随着计算机视觉技术的不断发展以及数字图像规模的爆炸式增长,图像场景分类已成为许多领域的关键任务,已经得到了广泛的研究和应用。图像场景分类旨在识别和理解图像中的场景类型,在实际应用中,图像场景分类仍然面临着许多挑战,如复杂的场景等。然而,现有的图像场景分类方法往往只关注全局或局部特征的提取,而忽略了全局和局部特征之间的互补关联。为了解决这些问题,微美全息(NASDAQ:WIMI)不断探索新的网络架构和算法,正在将全局-局部特征自适应融合(Global-local feature adaptive fusion,“GLFAF”)网络框架运用于图像场景分类的实践中,以进一步提高图像场景分类的准确性。

全局-局部特征自适应融合(GLFAF)网络框架采用设计的CNN来提取多尺度和多层次的图像特征。通过利用这些多尺度和多层次特征的互补优势,该框架还设计了全局特征聚合模块,以发现全局注意力特征,并进一步学习这些全局特征之间的空间尺度变化的多重深度依赖关系。同时,该框架还设计了局部特征聚合模块,用于聚合多尺度和多层次的特征。基于通道注意力融合同一尺度的多级特征,然后基于通道依赖聚合不同尺度的空间融合特征。此外,空间上下文注意力旨在跨尺度细化空间特征,不同的Fisher向量层旨在学习空间特征之间的语义聚合。另外,还引入了两个不同的特征自适应融合模块,以探索全局和局部聚合特征的互补关联,从而获得全面和差异化的图像场景呈现。

据悉,WIMI微美全息试图将全局-局部特征自适应融合 (GLFAF) 网络框架运用在图像场景分类的实践中,不仅提高了分类的准确性,还增强了特征提取的鲁棒性。通过全局特征聚合模块,网络能够捕捉到图像的全局特征,理解图像的整体结构和内容。而局部特征聚合模块则关注于图像的细节信息,能够提取出图像中的关键特征和细节信息。通过融合全局和局部特征,充分利用它们之间的互补关联,从而更全面、更准确地理解图像场景。同时,这种融合方式也能够更好地应对图像中的噪声和干扰。通过全局特征和局部特征的自适应融合,能够充分利用图像的上下文信息,提高场景分类的准确性和鲁棒性。同时,该网络也具有较好的通用性和可扩展性,可以应用于不同的场景分类任务。进一步提高了其在实际应用中的灵活性。

wKgaomWXuQWAPBs3AAE0XpPK3HQ090.jpg

全局-局部特征自适应融合 (GLFAF) 网络框架在图像场景分类的运用为计算机视觉领域的研究提供了一种新的思路和方法。此外,这种网络框架还具有很好的可扩展性。通过简单地调整网络结构,可以适应不同的图像场景分类任务,提高其在实际应用中的灵活性。同时,这种网络框架的设计思路也可以应用于其他计算机视觉任务,如目标检测、图像分割等,为这些任务提供更全面、更准确的特征表示。

在未来的研究中,WIMI微美全息将不断完善和优化网络结构,提高算法的性能和鲁棒性。此外,WIMI微美全息还将致力于将全局-局部特征自适应融合网络框架应用于其他更多的实际场景中,如智能交通、安防监控、医疗诊断等,为相关领域的发展和应用提供有力的支持。


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7409

    浏览量

    87691
  • 计算机视觉
    +关注

    关注

    8

    文章

    1696

    浏览量

    45923
收藏 人收藏

    评论

    相关推荐

    计算机视觉图像融合

    在许多计算机视觉应用(例如机器人运动和医学成像),需要将多个图像的相关信息整合到单一图像。这种图像
    的头像 发表于 08-01 08:28 530次阅读
    计算机视觉<b class='flag-5'>中</b>的<b class='flag-5'>图像</b><b class='flag-5'>融合</b>

    如何在自己的固件增加wifi自适应性相关功能,以通过wifi自适应认证测试?

    目前官方提供了自适应测试固件 ESP_Adaptivity_v2.0_26M_20160322.bin 用于进行 wifi 自适应认证测试. 请问如何在自己的固件增加 wifi 自适应
    发表于 07-12 08:29

    卷积神经网络有何用途 卷积神经网络通常运用在哪里

    和应用场景图像识别 图像识别是卷积神经网络最广泛的应用之一。CNN能够自动学习图像
    的头像 发表于 07-11 14:43 1850次阅读

    BP神经网络在语言特征信号分类的应用

    Network),即反向传播神经网络,作为一种强大的多层前馈神经网络,凭借其优异的非线性映射能力和高效的学习机制,在语言特征信号分类展现
    的头像 发表于 07-10 15:44 311次阅读

    计算机视觉怎么给图像分类

    图像分类是计算机视觉领域中的一项核心任务,其目标是将输入的图像自动分配到预定义的类别集合。这一过程涉及图像
    的头像 发表于 07-08 17:06 497次阅读

    全息投影呈现什么影像特征

    全息投影技术是一种利用光的干涉和衍射原理,将物体的三维信息记录在全息图上,并通过适当的光源再现物体的三维影像的技术。全息投影技术具有许多独特的影像特征,以下是对这些
    的头像 发表于 07-08 11:15 595次阅读

    全息投影运用了什么原理和技术

    全息投影技术是一种利用光学原理和数字技术实现三维立体图像显示的技术。它通过记录和再现物体的光波信息,使观众能够从不同角度观察到物体的立体形象。本文将介绍全息投影的原理、技术以及应用。 一、全息
    的头像 发表于 07-08 11:13 1414次阅读

    卷积神经网络分类方法有哪些

    ,包括基本原理、常见架构、优化策略、应用场景等。 1. 卷积神经网络的基本原理 卷积神经网络是一种前馈神经网络,其核心思想是通过卷积层提取输入数据的
    的头像 发表于 07-03 09:40 392次阅读

    卷积神经网络图像识别的应用

    卷积操作 卷积神经网络的核心是卷积操作。卷积操作是一种数学运算,用于提取图像局部特征。在图像
    的头像 发表于 07-02 14:28 914次阅读

    鸿蒙OS开发:【一次开发,多端部署】(自适应布局)

    针对常见的开发场景,方舟开发框架提炼了七种自适应布局能力,这些布局可以独立使用,也可多种布局叠加使用。
    的头像 发表于 05-25 16:36 1632次阅读
    鸿蒙OS开发:【一次开发,多端部署】(<b class='flag-5'>自适应</b>布局)

    鸿蒙OS开发:【一次开发,多端部署】应用(自适应布局)

    针对常见的开发场景,方舟开发框架提炼了七种自适应布局能力,这些布局可以独立使用,也可多种布局叠加使用。
    的头像 发表于 05-24 10:34 926次阅读
    鸿蒙OS开发:【一次开发,多端部署】应用(<b class='flag-5'>自适应</b>布局)

    未来已来,多传感器融合感知是自动驾驶破局的关键

    可以引导本车的摄像头针对运动目标做快速局部修正曝光(见下图),以此实时获取运动目标的分辨细节特征,并将局部修正曝光的图像融合雷达数据传输至自
    发表于 04-11 10:26

    Spring Boot和飞腾派融合构建的农业物联网系统-改进自适应加权融合算法

    接上集: 上次实验我们已经完成多传感器融合算法的设计,本次实验注意完成改进自适应加权融合算法设计。 一、背景 通过利用温室控制系统来管理温室内的各种设备并控制温度、湿度,可以更好地探索
    发表于 01-06 12:18

    CNN图像分类策略

    在深度学习出现之前,自然图像的对象识别过程相当粗暴简单:定义一组关键视觉特征(“单词”),识别每个视觉特征图像
    发表于 12-25 11:36 276次阅读
    CNN<b class='flag-5'>图像</b><b class='flag-5'>分类</b>策略

    LabVIEW开发自适应降噪ANC

    对如何控制整个ANC过程进行编程。在cRIO-9104 FPGA上运行的框图如下所示。 自适应降噪在当今的降噪应用很有用。通过使用LabVIEW自适应过滤器工具包,您可以根据不同的需求在台式计算机
    发表于 11-30 19:38