0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单目视觉识别的无限市场潜力

ml8z_IV_Technol 来源:cg 2018-12-01 11:13 次阅读

对单目来说物体越远,测距的精度越低,硬件上的缺点可以通过算法去弥补,近日有两篇关于单目视觉的研究论文曝光,一篇是单目视频的深度估计,另一篇则是单目3d物体识别,在数据集下测试都取得了不错的效果,我们熟悉的单目摄像头可能一直被低估了。

摄像头是自动驾驶汽车中重要的传感器之一,在自动驾驶过程中的首要任务就是道路识别 ,主要是图像特征法和模型匹配法来进行识别。行驶过程中需要进行障碍物检测和路标路牌识别等,此时车辆上的信息采集便可以运用单目视觉或者多目视觉。

由于很多图像算法的研究都是基于单目摄像机开发的,因此相对于其他类别的摄像机,单目摄像机的算法成熟度更高。基于单目摄像头可以用来定位、目标识别等。但是相比多目,单目有着先天的缺陷,视野信息不能够丰富,单目测距的精度也较低。

不过单目摄像头的作用还未发挥到极致,近日有两篇关于单目视觉的研究,让众多研究者惊艳,原来单目一样可以有不错的表现。

Paper1:

Orthographic Feature Transform for Monocular 3D Object Detection

单目3d物体检测是一件很有挑战性的事情,目前最先进系统的成绩也不及用激光雷达的1/10,剑桥大学的科学家利用单目视觉进行3d物体识别,通过引入正交特征变换,使基于图像的特征映射到正交3D空间,来避免形成图像域,可以全面地推断出各个物体比例尺寸以及相隔的距离。通过在KITTI数据集里测试,发现与前人的Mono3D方法对比,这种方法在鸟瞰图平均精确度、3D物体边界识别上各项测试成绩上均优于对手。

尤其在探测远处物体时要远超Mono3D,远处可识别出的汽车数量更多。甚至在严重遮挡、截断的情况下仍能正确识别出物体。在某些场景下甚至达到了3DOP系统的水平。

在这项工作中,提出的一种新颖的单目三维物体检测方法,基于在鸟瞰视野范围内操作的,减轻了许多不良图像的属性,更易于推断出世界的3D结构。用一种简单的正交特征变换,将基于图像的特征转换为这种鸟瞰视图表示, 并描述了如何使用图像积分有效地实现它,以深二维卷积网络的形式应用于提取的鸟瞰特征,取得了不错的效果,说明单目还有很大可开发的空间。

Paper2:

A Structured Approach to Unsupervised Depth Learning from Monocular Videos

这是谷歌的工程师做的一个研究,他利用单目视频深度估计,自从2014年NIPS上出现第一篇用CNN-based来做单目深度估计,近几年也不断涌现出一些做单目深度估计的文章,有直接依靠深度学习和网络架构得到结果,还有依靠于深度信息本身的性质进行估计,基于CRF和基于相对深度方法的,本篇文章是基于无监督学习单目视频深度估计。文中的方法能够模拟运动物体并产生高质量的深度估计结果,与以前的单目视频无监督学习方法相比,该方法能够恢复移动物体的正确深度。也就说,能够正确地恢复与自身运动车辆相同速度的移动汽车的深度。因为一台相对静止的车辆,往往会表现出与地面相同的无线深度特征,解决了高动态场景中的问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摄像头
    +关注

    关注

    59

    文章

    4807

    浏览量

    95411
  • 视觉识别
    +关注

    关注

    3

    文章

    89

    浏览量

    16689
  • 自动驾驶
    +关注

    关注

    783

    文章

    13682

    浏览量

    166124

原文标题:被低估的单目视觉识别

文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ASR与传统语音识别的区别

    识别技术。 构建更深更复杂的神经网络模型,利用大量数据进行训练。 提高了语音识别的准确率和稳定性。 传统语音识别 : 通常依赖于声学-语言模型的方法。 在处理复杂的语音输入时,可能表现不如ASR技术出色。 二、功能多样性 ASR
    的头像 发表于 11-18 15:22 296次阅读

    氮化镓(GaN)技术的迅猛发展与市场潜力

    市场潜力巨大。根据市场研究机构的预测,氮化镓功率元件市场的营收将在2024年显著增长,预计到2026年市场规模将达到13.3亿美元,复合年增长率高达65%。这一增长趋
    的头像 发表于 07-24 10:55 545次阅读
    氮化镓(GaN)技术的迅猛发展与<b class='flag-5'>市场潜力</b>

    如何设计人脸识别的神经网络

    人脸识别技术是一种基于人脸特征信息进行身份识别的技术,广泛应用于安全监控、身份认证、智能门禁等领域。神经网络是实现人脸识别的关键技术之一,本文将介绍如何设计人脸识别的神经网络。 人脸
    的头像 发表于 07-04 09:20 565次阅读

    人脸检测和人脸识别的区别是什么

    人脸检测和人脸识别是计算机视觉领域的两个重要技术,它们在许多应用场景中都有广泛的应用,如安全监控、身份验证、社交媒体等。尽管它们在某些方面有相似之处,但它们之间存在一些关键的区别。本文将详细介绍人
    的头像 发表于 07-03 14:49 923次阅读

    人脸检测与识别的方法有哪些

    人脸检测与识别是计算机视觉领域中的一个重要研究方向,具有广泛的应用前景,如安全监控、身份认证、智能视频分析等。本文将详细介绍人脸检测与识别的方法。 引言 人脸检测与识别技术在现代社会中
    的头像 发表于 07-03 14:45 628次阅读

    图像检测和图像识别的区别是什么

    详细的比较和分析。 定义和概念 图像检测(Image Detection)是指利用计算机视觉技术对图像中的特定目标进行定位和识别的过程。它通常包括目标的检测、分类和定位三个步骤。图像检测的目标可以是人、车、动物等任何具有特定特征
    的头像 发表于 07-03 14:41 793次阅读

    军用光电耦合器产品的市场潜力与应用前景

    光电耦合器作为现代军事技术中的关键组件,其在军用领域的市场空间和应用前景备受关注。本文将深入分析光电耦合器产品在军事领域中的市场潜力,探讨其技术特点、应用场景及未来发展趋势。
    的头像 发表于 06-28 11:50 263次阅读
    军用光电耦合器产品的<b class='flag-5'>市场潜力</b>与应用前景

    芯启源荣获“最具市场潜力中小企业奖”

    2024年6月20日下午,浙江省半导体行业协会四届三次会员大会在湖州南浔举行。芯启源与省内外专家学者、省半导体行业协会主要负责人、半导体行业相关企业等200余人共同参会,并凭借高速的市场增长、雄厚的科技实力和前瞻性的市场洞察荣获“最具
    的头像 发表于 06-22 11:09 970次阅读

    语音识别的技术历程及工作原理

    语音识别的本质是一种基于语音特征参数的模式识别,即通过学习,系统能够把输入的语音按一定模式进行分类,进而依据判定准则找出最佳匹配结果。
    的头像 发表于 03-22 16:58 2793次阅读
    语音<b class='flag-5'>识别的</b>技术历程及工作原理

    机器视觉的图像目标识别方法综述

    机器视觉代替传统的人工视觉,能够更好的满足危险作业基本需求。机器视觉的图像目标识别的重要性图像目标识别是机器
    的头像 发表于 02-23 08:26 687次阅读
    机器<b class='flag-5'>视觉</b>的图像目标<b class='flag-5'>识别</b>方法综述

    机器视觉的图像目标识别方法操作要点

    通过加强图像分割,能够提高机器视觉的图像目标识别的自动化水平,使得图像目标识别效果更加显著。图像分割的方法有很多种,不同方法分别适用于不同领域,这里重点介绍以下3种分割方法。
    发表于 01-15 12:17 398次阅读

    如何使用Python进行图像识别的自动学习自动训练?

    如何使用Python进行图像识别的自动学习自动训练? 使用Python进行图像识别的自动学习和自动训练需要掌握一些重要的概念和技术。在本文中,我们将介绍如何使用Python中的一些常用库和算法来实现
    的头像 发表于 01-12 16:06 535次阅读

    情感语音识别的应用与挑战

    一、引言 情感语音识别是一种通过分析人类语音中的情感信息实现智能化和个性化人机交互的技术。本文将探讨情感语音识别的应用领域、优势以及所面临的挑战。 二、情感语音识别的应用领域 娱乐产业:在娱乐产业中
    的头像 发表于 11-30 10:40 618次阅读

    情感语音识别的现状与未来趋势

    情感语音识别是一种涉及多个学科领域的前沿技术,包括心理学、语言学、计算机科学等。它通过分析人类语音中的情感信息,实现更加智能化和个性化的人机交互。本文将探讨情感语音识别的现状与未来趋势。
    的头像 发表于 11-28 17:22 751次阅读

    AI视觉识别有哪些工业应用

    AI视觉识别涵盖多种应用,如人脸识别、目标检测和识别、图像分割、行为识别、视频分析等。本篇就简单介绍一下AI
    的头像 发表于 11-27 18:05 1169次阅读
    AI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>有哪些工业应用