0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

目标物体识别算法:物体识别算法的一般路径

新机器视觉 来源:创来科技 作者:创来科技 2021-04-18 10:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导语:智能驾驶的决策执行依赖于对目标物体识别的精准判断,因而目标物体识别功能也是最早开始研发的部分。精度、响应度提升是现阶段技术关键。

物体识别分类对于速度和精度要求极高。一方面,物体的识别和分类是实时的,且结果的置信度要足够高。由于无人驾驶需要实时做出驾驶决策,而物体识别仅仅是其中一环,在做出判断前,需要给算法处理、决策效应到执行器留有足够时间,因此留给物体分类和识别器的时间很短,实时性要求非常高。

另一方面,汽车驾驶关系到乘客的生命安全,在此情况下,物体识别必须将误报、错判的概率和可能性降低到极低范围。一旦发生误判,系统执行错误的指令,则结果将是致命的。

目标物体识别难点

•目标物体差异化。


无人驾驶需要依赖算法来识别道路上的各种差异化目标。道路情况十分复杂,面对的物体多种多样。即使同一类物体,也存在外形、尺寸差异。同时,路面上的物体也可能以组合形式出现。以行人为例,行人有不同的静态和动态差异,静态包括行人的外形、服装、高矮胖瘦、体貌特征差异;动态差异指行人的运动状态,可能奔跑、行走或者静止。这就要求识别算法拥有极高的辨识度,能够区分路面上各个不同的物体,精准判断。

•环境和路况差异化。

实际道路行驶中,会碰到不同环境和路况,这就要求识别算法普适所有工况。例如:极端的天气情况(大雨、大雪、闪电、雾霾等)、不同的光照、不同的路况。

•在动态场景中进行识别。

在实际道路行驶中周围的场景都是运动的物体,从不同的视角看过去,不同的物体的坐标变化模式、姿态变化模式都会不同,识别难度进一步增加。

物体识别算法的一般路径

物体识别算法通常分为六个步骤:

前处理→前景分离→物体分类→结果改进→物体追踪→应用层面处理

前五个部分是算法的核心,第六部分则通常指后续的物体行为预测、路径规划、导航和防碰撞算法等。

c5340072-9fbb-11eb-8b86-12bb97331649.jpg

1

——前处理

此部分为最底层的机器视觉算法,通常包含摄像头曝光、增益控制、摄像头标定校准等步骤。由于路况复杂多变而实时性要求很高(例如当车辆快速驶入驶离隧道时,周围的光照变化剧烈,需要迅速做出调整),无人驾驶中对前处理算法的要求极高。

前处理算法需要保证输入到后续步骤的图像质量。图像质量会直接影响后续分类算法性能。尽管传统的机器视觉增强算法能够部分解决这一问题,但是使用高动态范围(HDR)的视觉传感器和配套算法将是未来的主要趋势。高动态范围传感器可以通过多次曝光运算增强图片对比度, “照亮” 场景。汽车上使用的 HDR 摄像头通常还会将近红外夜视波段也涵盖进去,实现夜视功能。

传感器自身的在线标定也在这一部分完成。由于传感器始终处于运动状态中,因此实时确认传感器自身的姿态尤为重要。单目摄像头往往通过跟踪不同图像帧之间的差别来确认自身姿态,而双目摄像头则使用额外的景深信息来实现这一功能。前者的可靠性较差,而后者则需要更多的计算资源。

2

——前景切分

前景切分的目的是尽可能过滤与待识别物体无关的背景信息(例如天空),并且将图像切分为适宜大小。一个好的前景切分算法可能将原先的 200k- 1000k 个待识别区域缩小到 20k-40k,大大减轻后续处理负担。主流算法有基于仿生原理的注意力算法等,但是这些算法往往需要依赖于预先收集的数据,这些数据规定了不同场景下的可能的背景区间信息。另外,额外的传感器输入(包括定位系统、双目摄像头或雷达提供的景深信息等)可以进一步加快前景切分。

一旦有了这些额外的信息,前景切分算法对图像区域是否处于前景(待识别)的判断确信度会大幅提升,大量背景区间将会被去除,大幅减少输入到物体识别器中的待识别区域,提高识别的速度和准确性。

c55bc8c8-9fbb-11eb-8b86-12bb97331649.jpg

3

——物体识别

将上一步骤生成的大量待识别区间归类为数百种已知的可能在道路上出现的物体,并且尽量减少误判。基本上所有的物体识别算法都是以二维图像作为输入的。这种输入分为两种,一种是将待识别区域图像中的边缘提取出来,将边缘信息输入分类器(可以辅以激光雷达以获得更高精度);另一种则是直接将图像的外观输入到分类器(通过摄像头实现)。前者在性能上基本已经到了极限,而后者则是目前研发的主要方向。

具体到算法,主流的特征提取方法包括梯度方向直方图法(HOG)和形状上下文描述符法(SCT),提取特征后进入分类程序。主流的 AI 分类学习算法包括支持向量机(SVM)、迭代分类算法(AdaBoost)和神经网络(NN)。

4

——验证与结果改进

这一步骤使用与分类方法不同的判据来验证分类的结果可靠性,并提取被归类为特定物体的待识别区间中更加详细的信息(例如交通标志)。由于雷达、激光雷达等非视觉传感器往往能够满足“冗余传感信息来源”这一要求,因此在实际算法中,这一部分也将应用大量的传感器融合。

c57dbd3e-9fbb-11eb-8b86-12bb97331649.jpg

5

——物体跟踪

这一步骤的目的有二。除了为应用层提供物体轨迹外,还能为前景切分、物体分类提供输入(告诉前景切分之前这个地方出现过什么)。目前最为常用的算法是卡尔曼滤波算法(用来跟踪、预测物体轨迹,根据过去空间位置预测未来位置)。在物体跟踪环节同样涉及较多的传感器融合算法,通过视觉数据预测轨迹,同时同雷达的物体跟踪数据进行耦合

精度和响应速度之间的最优选择

精度是视觉算法的核心,近年来视觉识别算法精度不断提高。视觉识别算法的精度由误检率和漏检率共同决定。物体识别本身的复杂性决定了这一功能必须以视觉为核心。

纵观过去十多年,视觉物体识别的精度有了长足的发展。以美国加州理工学院进行的一项行人识别的算法调查为例,当误判率为每张图 0.1 个行人时,纯视觉算法的漏检率已由 2004 年最早的 95%降低到了最近几年的 50%附近。

因此我们有理由相信在无人驾驶真正商用时,即使是纯视觉算法也能达到很高的物体识别精确度,而若加以传感器融合(在相同误判率下约能降低 10%的漏检率)和强大的车联网实时数据,无人驾驶阶段的精度要求将得以满足。

c5b0fb40-9fbb-11eb-8b86-12bb97331649.jpg

视觉识别算法精度提升途径

•视觉算法本身的优化。在前处理和前景分离阶段提取明确目标值,分类和学习系统的算法不断优化。这需要技术研发的不断投入,产生极高的进入壁垒,目前国内从事视觉算法研究的公司只有少数几家,因而也构成了标的稀缺性。

•通过传感融合算法冗余信息判断,提高精度。视觉识别以摄像头数据为主,同时辅以雷达、激光雷达的边界、距离信息。数据显示,在相同误判率下雷达的决策辅助能降低约 10%的漏检率。

•利用车联网、地图数据的辅助决策。无人驾驶的商用与车联网应用密不可分,通过 V2X 实时数据传输,协助车辆判断物体信息,同时通过 GPS 高精度定位和地图数据相结合,辅助物体的分类识别。

另外一个值得关注的问题是各种算法的处理速度。为了保证在高速行驶状态下的可靠性,物体识别的图像输入速率往往达到了 60~90fps (比一般摄像头帧数高 3-4 倍)。即使前景分离步骤每张图仅产生 20,000 个待识别区域,流入硬件的待识别区间也达到了每秒1200,000 个。目前算法在一台普通计算机下运行速度如下图所示。

c5cbdeec-9fbb-11eb-8b86-12bb97331649.jpg

面对如此大的计算量,通常情况会有如下几种解决方法:

第一, 算法上做出妥协。不使用过于复杂的算法,这意味着精度上要做出妥协。

第二, 优化算法架构,在算法上取得突破,分类器的性能往往是主流算法瓶颈,通过加强在前处理和前景分离过程中的数据筛选能力减少传输给分类环节的数据量。

第三, 更加强大的运算芯片。

第四, 定制专门的计算单元来处理物体识别计算,这需要较高的研发投入。CPU 用来处理日常的运算、排序、组合,GPU用来处理图像、着色、点距等信息,DSP 应用于处理时间序列信号。三者结合的定制芯片更为实用。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54593

    浏览量

    470594
  • 识别算法
    +关注

    关注

    0

    文章

    45

    浏览量

    10854
  • 无人驾驶
    +关注

    关注

    100

    文章

    4315

    浏览量

    127248

原文标题:目标物体识别算法:精度和响应度关乎生命

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    占据感知网络如何识别动态物体

    [首发于智驾最前沿微信公众号]占据感知网络(Occupancy Network,简称OCC)作为自动驾驶现阶段比较火热的项技术,直被很多人讨论。由于自动驾驶应用场景的特殊性,感知的物体大多是动态
    的头像 发表于 05-14 09:24 431次阅读
    占据感知网络如何<b class='flag-5'>识别</b>动态<b class='flag-5'>物体</b>?

    瑞芯微(EASY EAI)RV1126B 手势识别算法识别

    1.手势识别算法简介Gestures手势识别算法种先进的姿势估计模型,使用关键点数据集进行训练,能够检测图像或视频中人物的21个关键点与2
    的头像 发表于 04-07 10:36 180次阅读
    瑞芯微(EASY EAI)RV1126B 手势<b class='flag-5'>识别</b><b class='flag-5'>算法</b><b class='flag-5'>识别</b>

    自动驾驶汽车如何识别悬空物体

    依赖传感器的自动驾驶汽车而言,识别这些空间中的悬空物体却是个极其复杂的过程。 这些物体不与地面直接相连,或者其主体部分位于传感器常规扫描范围的边缘,很容易被
    的头像 发表于 04-02 09:03 391次阅读
    自动驾驶汽车如何<b class='flag-5'>识别</b>悬空<b class='flag-5'>物体</b>?

    瑞芯微(EASY EAI)RV1126B OCR文字识别

    1.OCR文字识别简介文字识别也是图像领域个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行文字的识别。所以一般
    的头像 发表于 01-12 10:19 7495次阅读
    瑞芯微(EASY EAI)RV1126B OCR文字<b class='flag-5'>识别</b>

    目标追踪的简易实现:模板匹配

    目标追踪和图像识别 一般来说,提到机器视觉这个概念都会想到图像识别,比如人脸识别、文本
    发表于 10-28 07:21

    自动驾驶汽车如何准确识别物体

    [首发于智驾最前沿微信公众号]自动驾驶汽车想要在道路上安全行驶,需要识别的东西远比我们所知道的诸如红绿灯、行人、车辆等复杂得多。其中有个是我们经常会忽略,但同样非常重要的障碍物,那就是小物体,像是
    的头像 发表于 08-22 09:11 807次阅读
    自动驾驶汽车如何准确<b class='flag-5'>识别</b>小<b class='flag-5'>物体</b>?

    【上海晶珩睿莓1开发板试用体验】物体识别的板端推理

    model/yolov5n.onnx desktop.jpg 加载模型和目标图片,处理后打印识别结果 下载保存路径中输出的识别结果图片 更多场景 包括动物、路口、水果、运动、卧
    发表于 08-18 21:25

    如何挑选人脸识别终端?人脸识别体机品牌排行榜

    考虑这些人脸识别终端的具体应用场景在哪里。下面,小编就总结了2025年最新的人脸识别体机品牌排行榜:、海康威视人脸门禁体机优势:采用先
    的头像 发表于 08-18 10:44 2501次阅读
    如何挑选人脸<b class='flag-5'>识别</b>终端?人脸<b class='flag-5'>识别</b><b class='flag-5'>一</b>体机品牌排行榜

    瑞芯微RK3576语音识别算法

    1.语音识别简介语音识别技术,也被称为自动语音识别(AutomaticSpeechRecognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二
    的头像 发表于 08-15 15:13 2527次阅读
    瑞芯微RK3576语音<b class='flag-5'>识别</b><b class='flag-5'>算法</b>

    人脸方向识别算法

    人脸识别
    深蕾半导体
    发布于 :2025年07月22日 09:58:29

    在树莓派5上使用YOLO进行物体和动物识别-入门指南

    大家好,接下来会为大家开个树莓派5和YOLO的专题。内容包括四个部分:在树莓派5上使用YOLO进行物体和动物识别-入门指南在树莓派5上开启YOLO人体姿态估计识别之旅YOLO
    的头像 发表于 07-17 17:16 2396次阅读
    在树莓派5上使用YOLO进行<b class='flag-5'>物体</b>和动物<b class='flag-5'>识别</b>-入门指南

    基于FPGA的SSD目标检测算法设计

    随着人工智能的发展,神经网络正被逐步应用于智能安防、自动驾驶、医疗等各行各业。目标识别作为人工智能的项重要应用也拥有着巨大的前景,随着深度学习的普及和框架的成熟,卷积神经网络模型的识别精度越来越高
    的头像 发表于 07-10 11:12 2837次阅读
    基于FPGA的SSD<b class='flag-5'>目标</b>检测<b class='flag-5'>算法</b>设计

    【正点原子STM32MP257开发板试用】基于 YOLO 模型的物体识别

    介绍; 官方 Demo 测试; 动态识别:加载 USB 摄像头实现动态画面的物体识别,结果显示在板载LCD屏; 静态识别:通过加载本地图片并执行板端推理实现静态图片的
    发表于 06-21 16:32

    【正点原子STM32MP257开发板试用】基于 MobileNet 的物体识别

    【正点原子STM32MP257开发板试用】基于 MobileNet 的物体识别 本文介绍了正点原子 STM32MP257 开发板实现物体识别的项目设计。 项目介绍 准备工作: Mobi
    发表于 06-20 20:43

    AI视觉识别收银称:水果生鲜店的“智能店员”

    在水果生鲜店中,采用AI视觉识别收银称不仅提升了顾客的购物体验,也为商家带来了诸多便利和效益。本文将详细介绍这技术的好处。、提升收银效率传统的收银方式需要人工逐
    的头像 发表于 06-07 10:19 986次阅读
    AI视觉<b class='flag-5'>识别</b>收银称:水果生鲜店的“智能店员”