国际计算机视觉竞赛PASCAL VOC，中星微以89.0分的总成绩位列第一-电子发烧友网

近日，在国际计算机视觉竞赛PASCAL VOC，中星微以89.0分的总成绩位列第一，获得目标检测单模型第一名。获胜的模型是一步法的目标检测模型，本文带来技术详解。

近日，在PASCAL VOC comp4目标检测竞赛中，中星微再创佳绩，获得了目标检测单模型第一名。

Pascal VOC是世界计算机视觉领域知名的竞赛，比赛中，参赛者要对人、猫、鸟、飞机、汽车、船、盆栽等20类物体进行检测。由于训练样本较少，场景变化多端，非常具有挑战性。中星微人工智能参赛团队VIM_SSD以89.0分的总成绩位列第一。

中星微人工智能芯片技术公司董事长兼总经理张韵东表示：“本次参赛的模型适合终端设备部署的简单模型一步法算法，能够取得与云端服务器复杂多模型算法相媲美的结果，实属不易。作为人工智能芯片公司，我们不仅要在芯片设计方面精益求精，同时更要在算法的精简优化方面取得突破，为客户提供前端智能设备的整体解决方案。”

一步法目标检测模型

中星微本次提交的深度学习模型和上次参加比赛的深度学习模型基本一致，仍然沿用了一步法的目标检测模型，基础网络采用VGG16，并未使用ResNet-101, ResNet-152等更复杂的网络，保证精度的情况下速度更快。第一次参加比赛的成绩是87.6，这次是89.0，精度提高很多。该结果不仅领先于所有的一步法算法，同时击败了所有的二步法算法。

中星微人工智能芯片技术公司研发副总裁艾国表示：“本次我们深度学习模型是上次模型的全面升级，仍然沿用了一步法的网络架构，重点改进和优化了训练相关的方法和技术，在不增加算法复杂度的情况下，使得网络的精度越来越高，这是我们公司要打造的核心技术。在前端嵌入式设备计算资源受限的情况下，我们通过调整网络结构和训练的方法提高精度，而不是不断增加网络复杂度。”

VOC 2012数据集图片测试结果

不仅是单模型，而且是一步法，尤其适用于嵌入式NPU

多模型融合是深度学习比赛中经常使用到的一个利器，它通常可以在各种不同的机器学习任务中使结果获得提升。顾名思义，多模型融合就是综合考虑多个不同模型的情况，并将它们的结果融合到一起。

虽然通过模型进行融合往往效果较好，但是其实现代价和计算开销也比较大。目前，中星微主要是从实际项目应用的角度来考虑，特别是前端应用，一般都是单模型。当然，后期也会考虑使用模型融合，来提升比赛结果的精度。

下表是目前PASCAL VOC竞赛前十名，可以看出，下面算法中大部分应用了更复杂的基础网络ResNet-101和ResNet-152，并且是两步法，也有多模型融合（ensemble）。而中星微的模型不仅是单模型，而且是一步法，在嵌入式NPU可以达到很高的帧率。

Method	Backbone	mAP (%)
Ali_DCN_SSD_ENSEMBLE	ResNet-101	89.2		ensemble
VIM_SSD(COCO+07++12, single model, one-stage)	VGG16	89.0	one-stage	single
FOCAL_DRFCN(VOC+COCO, single model)	ResNet-152	88.8	two-stage	single
R4D_faster_rcnn	-	88.6	-	-
FF_CSSD(VOC+COCO, one-stage, single model) [?]	ResNet101	88.4	one-stage	single
R-FCN, ResNet Ensemble(VOC+COCO)	ResNet	88.4	two-stage	ensemble
HIK_FRCN	ResNet-101	87.9	two-stage	single
VIM_SSD	VGG16	87.6	one-stage	single
Deformable R-FCN, ResNet-101 (VOC+COCO)	ResNet-101	87.1	two-stage	single
RefineDet(VOC+COCO,singlemodel,VGG16,one-stage)	VGG16	86.8	one-stage	single

阿里巴巴达摩院多模型融合网络Ali_DCN_SSD_ENSEMBLE的得分是89.2，只比中星微单模型网络高了0.2点，而阿里巴巴达摩院FF_CSSD（VOC+COCO, one-stage, single model）一步法单模型的精度是88.4，基础网络是ResNet101，和中星微差了0.6个点。

从安防监控到保护濒危野生动物，应用场景广泛

目标检测技术应用广泛，是AI场景落地的关键性技术之一。中星微的深度学习模型运行在前端智能设备（如智能摄像头上），广泛用于安防监控、安全生产、环境保护、个人健康监测等领域。

下面是一个环境保护的例子，在我国西部及藏区应用，其采用人工智能、深度学习对野生保护动物进行检测、识别、统计。从而达到对野生动物保护，生态环境平衡的目标。根据国家要求，增强保护野生动物、保护环境的意识，特别是对濒临灭绝的野生动物的研究和保护，更要加大力度；要从科研、技术角度解决野生动物保护和数量的实时状态。

如下图，是对藏羚羊的检测、识别、统计：

如下图，是对藏野驴的监测、识别、统计：

概念说明

精度：目标检测中衡量识别精度的指标是mAP（mean average precision）。在多个类别物体检测中，每一个类别都可以根据recall和precision绘制一条曲线，AP就是该曲线下的面积，mAP是多个类别AP的平均值，理论上最高mAP为1.0，也就是我们说的100分，89分其实就是0.89 mAP，下面是示例说明。

前端智能和云端智能：前端智能是将智能分析算法嵌入到前端设备，拿安防摄像机举例，就是摄像机采集的视频内容立即进行分析，提取出画面中关键的、感兴趣的、有效的信息，形成结构化的数据。前端智能因受各种资源限制，需要对算法复杂度、网络模型大小等有限制。

云端智能是将前端传感器采集的数据通过云端来完成智能分析，一般通过大型的GPU服务器来完成。因此相对于前端智能，计算资源、内存资源、存储资源、网络资源等都较大，因此对算法模型的限制比较小，可以部署很大的很复杂网络模型。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

中星微

中星微

+关注

关注
0

文章
28

浏览量
11238
人工智能

人工智能

+关注

关注
1791

文章
47279

浏览量
238510
计算机视觉

计算机视觉

+关注

关注
8

文章
1698

浏览量
45993

原文标题：目标检测竞赛利器：中星微一步法模型获国际算法竞赛第一名！

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

计算机视觉有哪些优缺点

计算机视觉作为人工智能领域的一个重要分支，旨在使计算机能够像人类一样理解和解释图像和视频中的信息。这一

发表于 08-14 09:49 •967次阅读

地平线科研论文入选国际计算机视觉顶会ECCV 2024

近日，地平线两篇论文入选国际计算机视觉顶会ECCV 2024，自动驾驶算法技术再有新突破。

发表于 07-27 11:10 •922次阅读

机器视觉和计算机视觉有什么区别

机器视觉和计算机视觉是两个密切相关但又有所区别的概念。一、定义机器视觉机器视觉，又称为

发表于 07-16 10:23 •537次阅读

计算机视觉的五大技术

计算机视觉作为深度学习领域最热门的研究方向之一，其技术涵盖了多个方面，为人工智能的发展开拓了广阔的道路。以下是对计算机视觉五大技术的详细解析

发表于 07-10 18:26 •1370次阅读

计算机视觉的工作原理和应用

图像和视频中提取有用信息，进而进行决策和行动。自1960年代第一批学术论文问世以来，计算机视觉技术已经取得了长足的发展，并在多个领域展现出巨大的应用潜力和价值。

发表于 07-10 18:24 •1989次阅读

计算机视觉与人工智能的关系是什么

引言 计算机视觉是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域的知识。人工智能则是研究如

发表于 07-09 09:25 •652次阅读

计算机视觉与智能感知是干嘛的

引言 计算机视觉（Computer Vision）是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等

发表于 07-09 09:23 •940次阅读

计算机视觉和机器视觉区别在哪

，旨在实现对图像和视频的自动分析和理解。机器视觉机器视觉是计算机视觉的一个分支，主要应用于工业自动化领域。它利用

发表于 07-09 09:22 •454次阅读

计算机视觉和图像处理的区别和联系

计算机视觉和图像处理是两个密切相关但又有明显区别的领域。 1. 基本概念 1.1 计算机视觉 计算机视觉

发表于 07-09 09:16 •1318次阅读

计算机视觉属于人工智能吗

属于，计算机视觉是人工智能领域的一个重要分支。引言 计算机视觉是一门研究如何使

发表于 07-09 09:11 •1306次阅读

深度学习在计算机视觉领域的应用

随着人工智能技术的飞速发展，深度学习作为其中的核心技术之一，已经在计算机视觉领域取得了显著的成果。计算机视觉，作为

发表于 07-01 11:38 •815次阅读

机器视觉与计算机视觉的区别

在人工智能和自动化技术的快速发展中，机器视觉（Machine Vision, MV）和计算机视觉（Computer Vision, CV）作为两个重要的分支领域，都扮演着至关重要的角色。尽管它们在

发表于 06-06 17:24 •1334次阅读

计算机视觉的主要研究方向

计算机视觉（Computer Vision, CV）作为人工智能领域的一个重要分支，致力于使计算机能够像人眼一样理解和解释图像和视频中的信息

发表于 06-06 17:17 •980次阅读

【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

感觉量子技术神奇神秘，希望通过阅读此书来认识量子计算机。先浏览一下目录：通过目录，基本可以确定这是一本关于量子计算机的科普书籍，主要包括什么是量子

发表于 03-05 17:37

计算机视觉的十大算法

视觉技术的发展起到了重要的推动作用。一、图像分割算法图像分割算法是计算机视觉领域的基础算法之一，它的主要任务是将图像分割成不同的区域或对象。

发表于 02-19 13:26 •1242次阅读

搜索历史

国际计算机视觉竞赛PASCAL VOC，中星微以89.0分的总成绩位列第一

评论

计算机视觉有哪些优缺点

地平线科研论文入选国际计算机视觉顶会ECCV 2024

机器视觉和计算机视觉有什么区别

计算机视觉的五大技术

计算机视觉的工作原理和应用

计算机视觉与人工智能的关系是什么

计算机视觉与智能感知是干嘛的

计算机视觉和机器视觉区别在哪

计算机视觉和图像处理的区别和联系

计算机视觉属于人工智能吗

深度学习在计算机视觉领域的应用

机器视觉与计算机视觉的区别

计算机视觉的主要研究方向

【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

计算机视觉的十大算法