0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国际计算机视觉竞赛PASCAL VOC,中星微以89.0分的总成绩位列第一

DPVg_AI_era 来源:未知 作者:李倩 2018-07-09 08:55 次阅读

近日,在国际计算机视觉竞赛PASCAL VOC,中星微以89.0分的总成绩位列第一,获得目标检测单模型第一名。获胜的模型是一步法的目标检测模型,本文带来技术详解。

近日,在PASCAL VOC comp4目标检测竞赛中,中星微再创佳绩,获得了目标检测单模型第一名。

Pascal VOC是世界计算机视觉领域知名的竞赛,比赛中,参赛者要对人、猫、鸟、飞机、汽车、船、盆栽等20类物体进行检测。由于训练样本较少,场景变化多端,非常具有挑战性。中星微人工智能参赛团队VIM_SSD以89.0分的总成绩位列第一。

中星微人工智能芯片技术公司董事长兼总经理张韵东表示:“本次参赛的模型适合终端设备部署的简单模型一步法算法,能够取得与云端服务器复杂多模型算法相媲美的结果,实属不易。作为人工智能芯片公司,我们不仅要在芯片设计方面精益求精,同时更要在算法的精简优化方面取得突破,为客户提供前端智能设备的整体解决方案。”

一步法目标检测模型

中星微本次提交的深度学习模型和上次参加比赛的深度学习模型基本一致,仍然沿用了一步法的目标检测模型,基础网络采用VGG16,并未使用ResNet-101, ResNet-152等更复杂的网络,保证精度的情况下速度更快。第一次参加比赛的成绩是87.6,这次是89.0,精度提高很多。该结果不仅领先于所有的一步法算法,同时击败了所有的二步法算法。

中星微人工智能芯片技术公司研发副总裁艾国表示:“本次我们深度学习模型是上次模型的全面升级,仍然沿用了一步法的网络架构,重点改进和优化了训练相关的方法和技术,在不增加算法复杂度的情况下,使得网络的精度越来越高,这是我们公司要打造的核心技术。在前端嵌入式设备计算资源受限的情况下,我们通过调整网络结构和训练的方法提高精度,而不是不断增加网络复杂度。”

VOC 2012数据集图片测试结果

不仅是单模型,而且是一步法,尤其适用于嵌入式NPU

多模型融合是深度学习比赛中经常使用到的一个利器,它通常可以在各种不同的机器学习任务中使结果获得提升。顾名思义,多模型融合就是综合考虑多个不同模型的情况,并将它们的结果融合到一起。

虽然通过模型进行融合往往效果较好,但是其实现代价和计算开销也比较大。目前,中星微主要是从实际项目应用的角度来考虑,特别是前端应用,一般都是单模型。当然,后期也会考虑使用模型融合,来提升比赛结果的精度。

下表是目前PASCAL VOC竞赛前十名,可以看出,下面算法中大部分应用了更复杂的基础网络ResNet-101和ResNet-152,并且是两步法,也有多模型融合(ensemble)。而中星微的模型不仅是单模型,而且是一步法,在嵌入式NPU可以达到很高的帧率。

Method Backbone mAP (%)
Ali_DCN_SSD_ENSEMBLE ResNet-101 89.2 ensemble
VIM_SSD(COCO+07++12, single model, one-stage) VGG16 89.0 one-stage single
FOCAL_DRFCN(VOC+COCO, single model) ResNet-152 88.8 two-stage single
R4D_faster_rcnn - 88.6 - -
FF_CSSD(VOC+COCO, one-stage, single model) [?] ResNet101 88.4 one-stage single
R-FCN, ResNet Ensemble(VOC+COCO) ResNet 88.4 two-stage ensemble
HIK_FRCN ResNet-101 87.9 two-stage single
VIM_SSD VGG16 87.6 one-stage single
Deformable R-FCN, ResNet-101 (VOC+COCO) ResNet-101 87.1 two-stage single
RefineDet(VOC+COCO,singlemodel,VGG16,one-stage) VGG16 86.8 one-stage single

阿里巴巴达摩院多模型融合网络Ali_DCN_SSD_ENSEMBLE的得分是89.2,只比中星微单模型网络高了0.2点,而阿里巴巴达摩院FF_CSSD(VOC+COCO, one-stage, single model)一步法单模型的精度是88.4,基础网络是ResNet101,和中星微差了0.6个点。

从安防监控到保护濒危野生动物,应用场景广泛

目标检测技术应用广泛,是AI场景落地的关键性技术之一。中星微的深度学习模型运行在前端智能设备(如智能摄像头上),广泛用于安防监控、安全生产、环境保护、个人健康监测等领域。

下面是一个环境保护的例子,在我国西部及藏区应用,其采用人工智能、深度学习对野生保护动物进行检测、识别、统计。从而达到对野生动物保护,生态环境平衡的目标。根据国家要求,增强保护野生动物、保护环境的意识,特别是对濒临灭绝的野生动物的研究和保护,更要加大力度;要从科研、技术角度解决野生动物保护和数量的实时状态。

如下图,是对藏羚羊的检测、识别、统计:

如下图,是对藏野驴的监测、识别、统计:

概念说明

精度:目标检测中衡量识别精度的指标是mAP(mean average precision)。在多个类别物体检测中,每一个类别都可以根据recall和precision绘制一条曲线,AP就是该曲线下的面积,mAP是多个类别AP的平均值,理论上最高mAP为1.0,也就是我们说的100分,89分其实就是0.89 mAP,下面是示例说明。

前端智能和云端智能:前端智能是将智能分析算法嵌入到前端设备,拿安防摄像机举例,就是摄像机采集的视频内容立即进行分析,提取出画面中关键的、感兴趣的、有效的信息,形成结构化的数据。前端智能因受各种资源限制,需要对算法复杂度、网络模型大小等有限制。

云端智能是将前端传感器采集的数据通过云端来完成智能分析,一般通过大型的GPU服务器来完成。因此相对于前端智能,计算资源、内存资源、存储资源、网络资源等都较大,因此对算法模型的限制比较小,可以部署很大的很复杂网络模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 中星微
    +关注

    关注

    0

    文章

    28

    浏览量

    11238
  • 人工智能
    +关注

    关注

    1791

    文章

    47279

    浏览量

    238510
  • 计算机视觉
    +关注

    关注

    8

    文章

    1698

    浏览量

    45993

原文标题:目标检测竞赛利器:中星微一步法模型获国际算法竞赛第一名!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    计算机视觉有哪些优缺点

    计算机视觉作为人工智能领域的个重要分支,旨在使计算机能够像人类样理解和解释图像和视频中的信息。这
    的头像 发表于 08-14 09:49 967次阅读

    地平线科研论文入选国际计算机视觉顶会ECCV 2024

    近日,地平线两篇论文入选国际计算机视觉顶会ECCV 2024,自动驾驶算法技术再有新突破。
    的头像 发表于 07-27 11:10 922次阅读
    地平线科研论文入选<b class='flag-5'>国际</b><b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>顶会ECCV 2024

    机器视觉计算机视觉有什么区别

    机器视觉计算机视觉是两个密切相关但又有所区别的概念。 、定义 机器视觉 机器视觉,又称为
    的头像 发表于 07-16 10:23 537次阅读

    计算机视觉的五大技术

    计算机视觉作为深度学习领域最热门的研究方向之,其技术涵盖了多个方面,为人工智能的发展开拓了广阔的道路。以下是对计算机视觉五大技术的详细解析
    的头像 发表于 07-10 18:26 1370次阅读

    计算机视觉的工作原理和应用

    图像和视频中提取有用信息,进而进行决策和行动。自1960年代第一批学术论文问世以来,计算机视觉技术已经取得了长足的发展,并在多个领域展现出巨大的应用潜力和价值。
    的头像 发表于 07-10 18:24 1989次阅读

    计算机视觉与人工智能的关系是什么

    引言 计算机视觉门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域的知识。人工智能则是研究如
    的头像 发表于 07-09 09:25 652次阅读

    计算机视觉与智能感知是干嘛的

    引言 计算机视觉(Computer Vision)是门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等
    的头像 发表于 07-09 09:23 940次阅读

    计算机视觉和机器视觉区别在哪

    ,旨在实现对图像和视频的自动分析和理解。 机器视觉 机器视觉计算机视觉个分支,主要应用于工业自动化领域。它利用
    的头像 发表于 07-09 09:22 454次阅读

    计算机视觉和图像处理的区别和联系

    计算机视觉和图像处理是两个密切相关但又有明显区别的领域。 1. 基本概念 1.1 计算机视觉 计算机视觉
    的头像 发表于 07-09 09:16 1318次阅读

    计算机视觉属于人工智能吗

    属于,计算机视觉是人工智能领域的个重要分支。 引言 计算机视觉门研究如何使
    的头像 发表于 07-09 09:11 1306次阅读

    深度学习在计算机视觉领域的应用

    随着人工智能技术的飞速发展,深度学习作为其中的核心技术之,已经在计算机视觉领域取得了显著的成果。计算机视觉,作为
    的头像 发表于 07-01 11:38 815次阅读

    机器视觉计算机视觉的区别

    在人工智能和自动化技术的快速发展中,机器视觉(Machine Vision, MV)和计算机视觉(Computer Vision, CV)作为两个重要的分支领域,都扮演着至关重要的角色。尽管它们在
    的头像 发表于 06-06 17:24 1334次阅读

    计算机视觉的主要研究方向

    计算机视觉(Computer Vision, CV)作为人工智能领域的个重要分支,致力于使计算机能够像人眼样理解和解释图像和视频中的信息
    的头像 发表于 06-06 17:17 980次阅读

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    感觉量子技术神奇神秘,希望通过阅读此书来认识量子计算机。 先浏览下目录: 通过目录,基本可以确定这是本关于量子计算机的科普书籍,主要包括什么是量子
    发表于 03-05 17:37

    计算机视觉的十大算法

    视觉技术的发展起到了重要的推动作用。、图像分割算法图像分割算法是计算机视觉领域的基础算法之,它的主要任务是将图像分割成不同的区域或对象。
    的头像 发表于 02-19 13:26 1242次阅读
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的十大算法