0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

行人再识别,澎思科技 ReID算法的三大突破

WpOh_rgznai100 来源:YXQ 2019-07-09 11:00 次阅读

不久前,江苏省某市公安通过 AI 技术分析监控摄像头中的信息,抓获了一个偷盗电动车的嫌疑人员。监控摄像头在现场拍到的是嫌疑人背对摄像头的情况,未有清晰正面的人脸,但图片显示了他的穿着、发型、身高等信息,而警方运用的技术则是计算机视觉领域中的行人再识别技术(Re-ID),通过Re-ID技术警方找到了关联摄像头正好拍到他的正脸,以此确认身份,迅速将嫌疑人抓获。这也是行人再识别技术在实战场景中的一个典型应用,而提供给警方技术支持的则是国内人工智能企业澎思科技(Pensees)。

行人再识别,澎思科技 ReID算法的三大突破

行人再识别起源于多摄像头跟踪,指在非重叠视角域多摄像头网络下进行的行人匹配,即确认不同位置的摄像头在不同的时刻拍摄到的行人目标是否为同一人。行人再识别涉及计算机视觉、机器学习、模式识别等多个学科领域。在行人再识别(ReID)技术研究领域,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量算法水平的核心指标。

近日,在行人再识别(Person Re-identification,简称ReID)算法上澎思科技取得了突破,在三大主流ReID数据集测试 Market1501、DukeMTMC-reID 和 CUHK03 中,算法关键指标首位命中率(Rank-1 Accuracy)刷新了世界纪录。

在三大数据集上,Rank-1 指标分别达到 96.73%、92.01% 和 84.57%超过了阿里巴巴、腾讯、大华、云从科技等头部厂家;在 CUHK03 数据集的实验中,mAP 也超过了之前的成绩。

澎思科技 Market1501 部分测试结果

澎思科技通过对算法的自研创新和融合探索,算法上的突破有以下三点:

1、金字塔水平分块策略:采用 human parsing 对人体分割,结合金字塔水平分块策略,使得网络准确提取细粒度区域特征的能力大幅提升;

如图所示, 特征图水平分割 6 等份,其幂集一共有种组合,去掉全集和空集以后还有种组合方式,这些特征区域可以组合成为新的特征图。对每个新的特征图进行常规操作(全局池化=>卷积=>批归一化=>激活函数=>全连接层=>ID 监督信号)。通过多监督信号的参与,可以大幅提高模型的精度和鲁棒性。

2、(1)渐进式训练策略;(2)图网络结构

(1)训练阶段,借鉴 curriculum learning 思路,难样本比例逐步提升,使得损失函数更易收敛。参与训练的样本按照学习难易度、按顺序进入和退出训练循环,模型在训练的同时评估各样本的难度,如此可以保证模型能够有效挖掘样本特征完成ReID任务。

(2)通过图网络结构,学习得到各个细粒度特征的加权系数,进一步提高特征的分辨能力。

如图所示,网络在学习行人特征提取的同时还要学习区分不同部分的人体结构,有的放矢地在这些区域提取特征并进行池化可以大大减少背景信息造成的干扰。同时使用图卷积网络对人体各部分的特征之关系经行建模可以得到一个人的整体表示,其效果要优于直接垂直等分特征图。

各部分的特征向量首先堆叠在一起形成特征矩阵,使用一维卷积分别混洗每行和每列的特征,让信息在各部分、各通道之间流动,重复一定次数以后可以得到稳定的整体特征。

3、重构距离:最后在测试阶段,除常规距离计算手段,引入重构距离,提升网络对未对齐、遮挡等技术难点的鲁棒性。

为了解决遮挡带来的精度下降问题,提出线性空间重构,利用参考图片的信息尝试尽可能地恢复残缺特征图,恢复后的特征图和参考特征图之间的距离即为重构距离。由此可以保证相似的图片之间可以互相重构,而不同个体的图片不管怎么重构都有一定的距离。从而提高了模型应对遮挡情况的能力。

ReID 算法持续优化,加速技术在多行业应用落地

ReID 算法加速技术在多行业应用落地

近年来受益于深度学习的发展,行人再识别(ReID)技术水平得到了巨大提升,超越人眼识别能力,并达到了商用的水平。作为人脸识别技术的重要补充,其发展内核便是在不同视频中,在无法获取清晰人脸特征信息前提下,机器通过穿着、发型、体态等信息将同一个人识别出来,增强数据的时空连接性。在公共安全(如智能视频监控、安保、刑侦)、智能零售、智能交通以及智慧城市等领域有很高的应用价值。

在公共安全领域,行人再识别技术在警务实战中可以作为人脸识别技术的有力补充,帮助公安视频侦查实现人脸、人体图像与数据联结,强化轨迹追踪功能,深化公安视频图像应用能力。

在智慧零售领域,行人再识别技术可以帮助商超收集“人”与“场”之间的关系数据并以可视化的方式重现。通过行人再识别技术追踪记录顾客店内行动轨迹,分析热点区域和商品关注度,分析不同区域的客流驻足率,从而据此优化商品陈列,获取最佳客流动线;感知客流峰谷,最受欢迎区域,合理配备人员,提升服务。同时,也将有助于基于用户行为画像,实现线下广告精准投放。

在智能制造、智慧园区等领域,行人再识别技术同样可以在提高员工工作效率,管理规范生产过程,降低企业管理成本,提升企业安保等级等方面有很多的应用场景。目前,澎思科技自研的 ReID 算法已经在不同行业的多个业务场景中落地应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4613

    浏览量

    92948
  • 计算机视觉
    +关注

    关注

    8

    文章

    1698

    浏览量

    46005

原文标题:超阿里、大华,澎思科技行人再识别(ReID)技术刷新三大数据集记录

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    第一届“峰云・大模型AI校园应用创新赛完美结束

    在大模型人工智能的浪潮中,峰科技与中科曙光强强联合,共同打造了一场大模型AI创新应用盛宴——第一届“峰云・大模型 AI 校园应用创新赛”。这场赛事不仅是技术的较量,更是智慧的火花碰撞。
    的头像 发表于 11-11 10:59 397次阅读

    峰云”校园行:湖南科技职业学院站,共启校园创新之旅!

    活动回顾 在金秋十月的尾巴,峰科技的“峰云”校园行活动来到了 湖南科技职业学院·软件学院 。峰科技为师生们带来了一场主题为“ 利用大模型技术打造AI创意应用 ”的技术分享。在这里,他们不仅
    的头像 发表于 10-24 11:41 252次阅读
    “<b class='flag-5'>澎</b>峰云”校园行:湖南科技职业学院站,共启校园创新之旅!

    峰科技“峰云”校园行活动回顾

    在金秋十月的尾巴,峰科技的“峰云”校园行活动来到了湖南科技职业学院·软件学院。峰科技为师生们带来了一场主题为“利用大模型技术打造AI创意应用”的技术分享。在这里,我们不仅分享了最前沿的AI技术,更点燃了学生们对科技的热情和
    的头像 发表于 10-24 11:22 420次阅读

    峰科技高性能大模型推理引擎PerfXLM解析

    自ChatGPT问世以来,大模型遍地开花,承载大模型应用的高性能推理框架也不断推出,大有百家争鸣之势。在这种情况下,峰科技作为全球领先的智能计算服务提供商,在2023年11月25日发布了针对大语言
    的头像 发表于 09-29 10:14 488次阅读
    <b class='flag-5'>澎</b>峰科技高性能大模型推理引擎PerfXLM解析

    峰科技携大解决方案亮相WAIC 2024

    2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)将在上海世博中心展览馆举行。峰科技将在世博展览馆H1-D1022展位为您呈现前沿的技术成果和创新的产品解决方案。
    的头像 发表于 09-29 10:05 373次阅读

    深度识别算法包括哪些内容

    深度识别算法是深度学习领域的一个重要组成部分,它利用深度神经网络模型对输入数据进行高层次的理解和识别。深度识别算法涵盖了多个方面的内容,主要
    的头像 发表于 09-10 15:28 390次阅读

    中伟视界:矿山智能化——实时检测识别井下行人车辆,人工智能赋能高风险作业安全

    行车不行人检测AI分析算法通过利用人工智能和深度学习技术,对井下行人和车辆的行驶情况进行实时检测和识别,应用于矿山等高风险作业环境中。该算法
    的头像 发表于 07-16 19:37 547次阅读
    中伟视界:矿山智能化——实时检测<b class='flag-5'>识别</b>井下<b class='flag-5'>行人</b>车辆,人工智能赋能高风险作业安全

    图像识别算法有哪几种

    图像识别算法是计算机视觉领域的核心技术之一,它通过分析和处理图像数据,实现对图像中的目标、场景和物体的识别和分类。 图像识别算法的发展历程
    的头像 发表于 07-16 11:22 1100次阅读

    图像识别算法都有哪些方法

    图像识别算法是计算机视觉领域的核心任务之一,它涉及到从图像中提取特征并进行分类、识别和分析的过程。随着深度学习技术的不断发展,图像识别算法
    的头像 发表于 07-16 11:14 5622次阅读

    图像识别算法的提升有哪些

    引言 图像识别是计算机视觉领域的核心任务之一,旨在使计算机能够自动地识别和理解图像中的内容。随着计算机硬件的发展和深度学习技术的突破,图像识别算法
    的头像 发表于 07-16 11:12 662次阅读

    图像识别算法的优缺点有哪些

    图像识别算法是一种利用计算机视觉技术对图像进行分析和理解的方法,它在许多领域都有广泛的应用,如自动驾驶、医疗诊断、安全监控等。然而,图像识别算法也存在一些优缺点。 一、图像
    的头像 发表于 07-16 11:09 1661次阅读

    图像识别算法的核心技术是什么

    图像识别算法是计算机视觉领域的一个重要研究方向,其目标是使计算机能够像人类一样理解和识别图像中的内容。图像识别算法的核心技术包括以下几个方面
    的头像 发表于 07-16 11:02 654次阅读

    opencv图像识别有什么算法

    图像识别算法: 边缘检测 :边缘检测是图像识别中的基本步骤之一,用于识别图像中的边缘。常见的边缘检测算法有Canny边缘检测器、Sobel边
    的头像 发表于 07-16 10:40 1062次阅读

    化工厂液体泄漏识别预警算法

    化工厂液体泄漏识别预警基于图像识别算法是计算机视觉的基础算法,例如VGG,GoogLeNet,ResNet等,化工厂液体泄漏识别这类
    的头像 发表于 07-03 08:35 411次阅读
    化工厂液体泄漏<b class='flag-5'>识别</b>预警<b class='flag-5'>算法</b>

    峰科技与并行科技共拓AI大模型技术创新应用服务

    4月17日,峰(北京)科技有限公司(以下简称“峰科技”)与北京并行科技股份有限公司(以下简称“并行科技”)签署战略合作协议。
    的头像 发表于 04-23 09:54 435次阅读
    <b class='flag-5'>澎</b>峰科技与并行科技共拓AI大模型技术创新应用服务