0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

YOLOv10:引领无NMS实时目标检测的新纪元

新机器视觉 来源:新机器视觉 2024-11-13 17:12 次阅读

来自中国清华大学的研究人员推出了YOLOv10,这是一种具有卓越进步的创新模型,展示了在计算机视觉领域的重要突破。这次发布体现了让AI既易于使用又功能强大的承诺,标志着重大进展和改进。

YOLO(You Only Look Once)系列一直是实时目标检测的基准,成功平衡了计算成本和检测性能。尽管在架构设计和优化策略方面取得了进展,但对非最大值抑制(NMS)的依赖阻碍了端到端部署,影响了推理延迟。YOLOv10通过消除NMS并优化模型架构推进了效率和性能的边界。

在这些进展的背景下,OpenSistemas在AI领域脱颖而出,特别是在训练、测试和部署如YOLOv10这样的模型方面。凭借对前沿技术的深刻理解和专长,OpenSistemas能够充分利用YOLOv10的功能,提升目标检测任务的精度和效率。这种合作象征着创新与实际应用的融合,推动了AI技术的可能性。

YOLOv10 的特别之处

YOLOv10的主要显著进步是消除了非最大值抑制(NMS)。NMS是许多目标检测模型中用于消除检测到同一对象的冗余边界框的后处理步骤。它通过保留得分最高的边界框并移除其他重叠显著的框来工作。尽管有效,但NMS增加了计算复杂性并增加了推理延迟,这会减慢实时应用的速度。

YOLOv10通过采用一致的双分配方法进行无NMS训练,改变了模型处理重叠检测的方式。通过将这一过程集成到模型的架构和训练策略中,YOLOv10减少了后处理的需要,大大缩短了推理时间。这种延迟的减少对于速度和效率至关重要的实时应用,如自动驾驶、监控和实时视频分析至关重要。消除NMS不仅简化了部署过程,还通过提高模型的效率和响应能力来提升其性能。

预训练模型

自从Ultralytics发布YOLOv5以来,我们已经习惯了每次YOLO发布时提供各种模型尺寸:nano、small、medium、large和xlarge。YOLOv10也不例外,清华大学的研究人员也提供了一系列预训练模型,可以用于各种目标检测任务。

所有这些模型在延迟和平均精度(AP)方面表现出优于之前YOLO版本的性能,如下图所示:

bcd8dda8-9067-11ef-a511-92fbcf53809c.png

(图:各YOLO模型在延迟(左)和参数数量(右)方面的性能比较)

你可以在下表中查看实际性能:

bcf3f8d6-9067-11ef-a511-92fbcf53809c.png

(表:可用的YOLOv10预训练模型,来源:Ultralytics网站)

使用

我们将尝试使用原始的仓库:

git clone https://github.com/THU-MIG/yolov10
cd yolov10
pip install -e .

# Choose the size of your model I will use the XLarge version
wget https://github.com/THU-MIG/yolov10/releases/download/v1.1/yolov10n/s/m/b/l/x.pt

然后,使用方法类似于YOLOv8:

Python

from ultralytics import YOLOv10 # Note the "v10" in the end
# Load a model
model = YOLOv10('yolov10x.pt') # load an official model
# Predict with the model
model.predict(0) # predict on your webcam

CLI

yolo predict model=yolov10x.pt source=0 # predict with official model on webcam

Ultralytics框架的预测源也可用:

bd235f04-9067-11ef-a511-92fbcf53809c.png

(图:可用于预测的源,来源:Ultralytics文档)

结果

bd4e0d30-9067-11ef-a511-92fbcf53809c.png

(图:YOLOv10的目标检测示例。推理分辨率为384x640)

YOLOv8 vs YOLOv10: 推理延迟

比较YOLOv8和YOLOv10时,最显著的改进之一是推理延迟的减少。推理延迟,即模型处理图像并进行预测所需的时间,对于自动驾驶、视频监控和交互式AI系统等实时应用至关重要。

YOLOv8尽管高效且强大,但依赖于非最大值抑制(NMS)来过滤冗余边界框。这个额外步骤虽然有效地提高了检测准确性,但增加了计算开销并延长了整体推理时间。

而YOLOv10通过一致的双分配方法进行无NMS训练,消除了对NMS的需求。通过将这一过程集成到模型架构中,YOLOv10显著减少了推理过程中所需的计算步骤。这使得处理时间更快,延迟更低,使YOLOv10更适合高速实时应用。

在同一个视频上,我使用NVIDIA GeForce RTX 4060 Laptop GPU, 7940MiB,得到的日志显示差异非常大:

bd7a2e06-9067-11ef-a511-92fbcf53809c.png

(图:YOLOv10在384x640分辨率下的推理延迟)

bd99119a-9067-11ef-a511-92fbcf53809c.png

(图:YOLOv8在384x640分辨率下的推理延迟)

导出模型

如果你想了解导出模型的好处,可以查看这篇详细介绍速度改进的文章。类似于其他任务,如检测、分割和姿势估计,你可以使用Ultralytics框架导出YOLOv10模型。此过程包括将模型转换为ONNX、CoreML、TensorFlow Lite等格式,确保与各种平台和设备的兼容性。

这种多功能性允许在不同环境中更广泛的集成,从移动应用到边缘设备。与前辈一样,YOLOv10框架支持模型导出,便于在各种平台上无缝部署。

Python

from ultralytics import YOLOv10
# Load a model
model = YOLOv10('yolov10x.pt') # load an official model
model = YOLOv10('path/to/best.pt') # load a custom trained model

# Export the model
model.export(format='onnx')

CLI

yolo export model=yolov10x.pt format=onnx # export official model
yolo export model=path/to/best.pt format=onnx # export custom trained model

结论

清华大学研究人员推出的YOLOv10,作为首个无NMS目标检测模型,代表了计算机视觉领域的重大进步。与YOLOv8相比,YOLOv10显著减少了推理延迟,使其更适合高速实时应用,如自动驾驶、视频监控和交互式AI系统。这种推理过程中计算步骤的减少突显了YOLOv10的效率和响应能力。

此外,YOLOv10采用了新的无NMS训练方法,对其各部分进行了微调以提高性能,并在速度和准确性之间达到了很好的平衡。这些升级使得模型的部署更容易,性能更强,速度更快,响应更迅速。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29892

    浏览量

    268180
  • 目标检测
    +关注

    关注

    0

    文章

    203

    浏览量

    15579
  • 计算机视觉
    +关注

    关注

    8

    文章

    1695

    浏览量

    45911

原文标题:YOLOv10:无NMS实时目标检测的先锋

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    在树莓派上部署YOLOv5进行动物目标检测的完整流程

    卓越的性能。本文将详细介绍如何在性能更强的计算机上训练YOLOv5模型,并将训练好的模型部署到树莓派4B上,通过树莓派的摄像头进行实时动物目标检测。 一、在电脑上训练
    的头像 发表于 11-11 10:38 189次阅读
    在树莓派上部署<b class='flag-5'>YOLOv</b>5进行动物<b class='flag-5'>目标</b><b class='flag-5'>检测</b>的完整流程

    高精度3D Hall摇杆专用芯片,开启操控新纪元

    在飞控领域中的3D霍尔摇杆,开启操控新纪元
    的头像 发表于 10-30 09:29 165次阅读
    高精度3D Hall摇杆专用芯片,开启操控<b class='flag-5'>新纪元</b>

    倒计时1天 | 第三届OpenHarmony技术大会——明天,上海见!

    技术引领筑生态,万物智联创未来 OpenHarmony 开源生态 繁荣于各方共建,又赋能于千行百业 开创了万物智联的新纪元,开源盛事,亦是开源盛世!
    发表于 10-11 23:29

    跨越地理限制:动态海外住宅IP技术引领全球化网络新纪元

    跨越地理限制:动态海外住宅IP技术引领全球化网络新纪元这一主题,凸显了动态海外住宅IP技术在全球化网络环境中的重要作用。
    的头像 发表于 09-27 08:30 241次阅读

    能耗管理系统新纪元:智能科技引领绿色生活风尚

    能耗管理系统新纪元:智能科技引领绿色生活风尚 在科技日新月异的今天,我们的生活正经历着前所未有的变革,而能耗管理系统作为连接环保与可持续发展的桥梁,正步入一个由智能科技引领新纪元。这
    的头像 发表于 08-15 18:17 463次阅读

    基于迅为RK3588【RKNPU2项目实战1】:YOLOV5实时目标分类

    【RKNPU2项目实战1】:YOLOV5实时目标分类 https://www.bilibili.com/video/BV1ZN411D7V8/?spm_id_from=333.999.0.0
    发表于 08-15 10:51

    AI技术引领奥运转播新纪元

    随着第33届夏季奥林匹克运动会在法国巴黎璀璨启幕,一场前所未有的科技与体育盛宴正席卷全球。在这场盛宴中,AI技术以其独特的魅力,深度融入了赛事的每一个角落,从数据的实时捕捉与分析,到超高清画面的全球无缝对接,正引领着奥运转播迈向一个崭新的
    的头像 发表于 08-06 17:08 682次阅读

    比尔·盖茨展望AI:耳机与智能眼镜引领人机交互新纪元

    我们描绘了一幅人工智能(AI)技术普及后,生活与工作方式的全新图景。他特别指出,耳机与智能眼镜将成为AI硬件领域的两大焦点,引领人机交互进入前所未有的新纪元
    的头像 发表于 07-04 16:34 848次阅读

    YOLOv5的原理、结构、特点和应用

    YOLOv5(You Only Look Once version 5)是一种基于深度学习的实时目标检测算法,它属于卷积神经网络(CNN)的范畴。下面我将详细介绍
    的头像 发表于 07-03 09:23 4611次阅读

    用OpenVINO C# API在intel平台部署YOLOv10目标检测模型

    最近YOLO家族又添新成员:YOLOv10YOLOv10提出了一种一致的双任务方法,用于nms训练的YOLOs,它同时带来了具有竞争力的性能和较低的推理延迟。此外,还介绍了整体效率
    的头像 发表于 06-21 09:23 925次阅读
    用OpenVINO C# API在intel平台部署<b class='flag-5'>YOLOv10</b><b class='flag-5'>目标</b><b class='flag-5'>检测</b>模型

    技嘉科技推出GIGABYTE AI TOP,引领本地AI训练新纪元

    技嘉科技在COMPUTEX 2024前夕推出GIGABYTE AI TOP,引领本地AI训练新纪元   在即将到来的COMPUTEX 2024科技盛会前夕,全球知名的计算机硬件制造商技嘉
    的头像 发表于 06-11 14:11 829次阅读

    一图看懂2024华为智能充电网络开启超充新纪元

    一图看懂2024华为智能充电网络开启超充新纪元
    的头像 发表于 04-29 10:27 530次阅读
    一图看懂2024华为智能充电网络开启超充<b class='flag-5'>新纪元</b>

    OpenVINO™ C# API部署YOLOv9目标检测和实例分割模型

    YOLOv9模型是YOLO系列实时目标检测算法中的最新版本,代表着该系列在准确性、速度和效率方面的又一次重大飞跃。
    的头像 发表于 04-03 17:35 705次阅读
    OpenVINO™ C# API部署<b class='flag-5'>YOLOv</b>9<b class='flag-5'>目标</b><b class='flag-5'>检测</b>和实例分割模型

    高通重磅发布第三代骁龙7+,引领AI与性能新纪元

    近日,科技界掀起一阵狂潮,高通技术公司盛大发布第三代骁龙7+移动平台,此举不仅将终端侧生成式AI技术首次引入骁龙7系,更在性能上实现飞跃,CPU性能飙升15%,GPU性能更是惊人提升45%。这一革命性的移动平台,无疑将引领智能手机行业进入全新的AI与性能新纪元
    的头像 发表于 03-25 09:46 1338次阅读

    深入浅出Yolov3和Yolov4

    Yolov3是目标检测Yolo系列非常非常经典的算法,不过很多同学拿到Yolov3或者Yolov4的cfg文件时,并不知道如何直观的可视化查
    的头像 发表于 01-11 10:42 728次阅读
    深入浅出<b class='flag-5'>Yolov</b>3和<b class='flag-5'>Yolov</b>4