0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶注释数据:如何判断数据集的有效性

ss 来源:智车科技IV 作者:智车科技IV 2020-12-11 13:47 次阅读

数据是现代机器学习应用程序中最重要的组成部分,包括自动驾驶汽车的感知系统都是依靠数据进行训练的。目前汽车都配备了许多传感器,这些传感器收集信息并输入到汽车计算机,然后信息必须进行实时处理和注释,以便汽车了解行驶中道路前方的情况。但是,汽车计算机上的算法需要接受有关如何进行分类的训练,所以数据标注的准确性变得很重要。以下是Annotell公司在数据标注上的一些探索。

带注释的数据至关重要,它有两个目的:在汽车上的计算机上训练算法以解释收集的信息,并验证计算机确实已学会正确解释收集的信息。由于注释数据用于这两个关键目的,因此注释的质量至关重要。最终,低质量的注释可能会导致汽车误解道路上正在发生的事情。

注释数据的过程始终包括一些人为的决定,第一个挑战就是让人们同意对记录的数据进行正确的注释,而创建这样的注释准则有时并不像人们想象的那么容易。往往需要有效设计注释准则以提高质量方面具有丰富的经验。第二个挑战是在指南的指导下按比例执行注释。

如何判断数据集的有效性?

量化注释质量的一种方法是注释数据集的精度和召回率。考虑一下标注的类型,其中摄像机图像中的一个对象(如接近的车辆)由一个边界框标注。在对此类数据集的质量进行推理时,有两个重要的问题(i)感兴趣的对象是否已由边界框正确标注,以及(ii)边界框是否实际上包含感兴趣的对象。

上面示意图中出现了错误标注。而在完美注释的数据集中,以上两个错误均不存在。因此,定义质量的一种方法是计算这些错误在带注释的数据集中出现的程度。例如计算

实际表示对象的包围盒的比率。这称为精度。理想情况下,精度为1。用边界框正确注释的对象的比率。这就是所谓的召回。理想情况下,召回率为1。

但是,计算数据集的精度和召回率还需要对整个数据集中的每个帧进行人工批判性检查,这可能与注释过程本身一样昂贵!为了在计算精度和召回率时获得效率,因此Annotell团队依靠统计数据来推断精度和召回率。仅对所有注释的统计选择良好的子集进行人工批判性审查,并使用概率论得出有关整个数据集的结论。

更详细地讲,他们使用贝叶斯方法来计算后验分布,以提高精度并召回整个数据集,这取决于已经进行了严格审查的注释的子样本。它不仅提供了精确度和召回率的估计,而且还量化了这些估计中的不确定性。例如,我们可以计算所谓的95%可信度下限,这意味着可以确定95%的精度或召回率不低于此阈值。

Annotell公司提供了一种具有成本效益的工具,用于根据精度和召回级别以及对级别的确定性来衡量注释的质量。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7221

    浏览量

    90118
  • 注释
    +关注

    关注

    0

    文章

    11

    浏览量

    6553
  • 自动驾驶
    +关注

    关注

    787

    文章

    13992

    浏览量

    167632
收藏 人收藏

    评论

    相关推荐

    自动驾驶行业,分析数据标注在人工智能的重要

    自动驾驶中,数据标注的作用尤为突出。自动驾驶系统依赖大量传感器数据(如摄像头、激光雷达、雷达等)来感知周围环境,而这些数据必须经过精确标注
    的头像 发表于 02-08 15:43 273次阅读

    自动驾驶角度解析数据标注对于人工智能的重要

    自动驾驶中,数据标注的作用尤为突出。自动驾驶系统依赖大量传感器数据(如摄像头、激光雷达、雷达等)来感知周围环境,而这些数据必须经过精确标注
    的头像 发表于 02-08 15:40 778次阅读
    以<b class='flag-5'>自动驾驶</b>角度解析<b class='flag-5'>数据</b>标注对于人工智能的重要<b class='flag-5'>性</b>

    从《自动驾驶地图数据规范》聊高精地图在自动驾驶中的重要

    自动驾驶地图作为L3级及以上自动驾驶技术的核心基础设施,其重要随着智能驾驶技术的发展愈发显著。《自动驾驶地图
    的头像 发表于 01-05 19:24 1848次阅读
    从《<b class='flag-5'>自动驾驶</b>地图<b class='flag-5'>数据</b>规范》聊高精地图在<b class='flag-5'>自动驾驶</b>中的重要<b class='flag-5'>性</b>

    自动驾驶中常提的鲁棒是个啥?

    随着自动驾驶技术的快速发展,鲁棒(Robustness)成为评价自动驾驶系统的重要指标之一。很多小伙伴也会在自动驾驶相关的介绍中,对某些功能用鲁棒
    的头像 发表于 01-02 16:32 3055次阅读
    <b class='flag-5'>自动驾驶</b>中常提的鲁棒<b class='flag-5'>性</b>是个啥?

    一文聊聊自动驾驶测试技术的挑战与创新

    ,包括场景生成的多样与准确、多传感器数据融合的精度验证、高效的时间同步机制,以及仿真平台与实际场景的匹配等问题。 自动驾驶测试的必要
    的头像 发表于 12-03 15:56 369次阅读
    一文聊聊<b class='flag-5'>自动驾驶</b>测试技术的挑战与创新

    标贝科技:自动驾驶中的数据标注类别分享

    自动驾驶训练模型的成熟和稳定离不开感知技术的成熟和稳定,训练自动驾驶感知模型需要使用大量准确真实的数据。据英特尔计算,L3+级自动驾驶每辆汽车每天产生的
    的头像 发表于 11-22 15:07 1281次阅读
    标贝科技:<b class='flag-5'>自动驾驶</b>中的<b class='flag-5'>数据</b>标注类别分享

    标贝科技:自动驾驶中的数据标注类别分享

    自动驾驶训练模型的成熟和稳定离不开感知技术的成熟和稳定,训练自动驾驶感知模型需要使用大量准确真实的数据。据英特尔计算,L3+级自动驾驶每辆汽车每天产生的
    的头像 发表于 11-22 14:58 1863次阅读
    标贝科技:<b class='flag-5'>自动驾驶</b>中的<b class='flag-5'>数据</b>标注类别分享

    车厂如何安全有效自动驾驶路测?

    自动驾驶技术依赖先进的传感器、算法和通信技术来实现车辆的自主导航和决策。在这些技术中,CANFD和车载以太网是两种关键的通信协议,它们为车辆内部和车辆之间的数据交换提供了高速和可靠的连接。中国
    的头像 发表于 08-03 08:25 872次阅读
    车厂如何安全<b class='flag-5'>有效</b>做<b class='flag-5'>自动驾驶</b>路测?

    FPGA在自动驾驶领域有哪些优势?

    。 硬件级安全: 自动驾驶系统对安全有极高的要求。FPGA的硬件级安全使其能够在硬件层面实现数据加密、防篡改和防攻击等安全功能,确保自动驾驶
    发表于 07-29 17:11

    FPGA在自动驾驶领域有哪些应用?

    FPGA(Field-Programmable Gate Array,现场可编程门阵列)在自动驾驶领域具有广泛的应用,其高性能、可配置、低功耗和低延迟等特点为自动驾驶的实现提供了强有力的支持。以下
    发表于 07-29 17:09

    中级自动驾驶架构师应该学习哪些知识

    随着自动驾驶技术的成熟,对系统架构师的需求逐渐增加。自动驾驶系统架构师负责设计整个系统的结构、组件、接口和数据流;需要协调不同领域的专业知识,确保系统的可靠、安全
    的头像 发表于 06-20 21:47 377次阅读

    初级自动驾驶架构师应该学习哪些知识

    随着自动驾驶技术的成熟,对系统架构师的需求逐渐增加。自动驾驶系统架构师负责设计整个系统的结构、组件、接口和数据流;需要协调不同领域的专业知识,确保系统的可靠、安全
    的头像 发表于 06-20 21:45 422次阅读

    标贝数据采集标注在自动驾驶场景中落地应用实例

    AI数据服务作为人工智能和机器学习的基础,在自动驾驶领域中有着重要地位。与其他人工智能应用场景相比,自动驾驶的落地场景相对复杂,想要让汽车本身的算法做到处理更多、更复杂的场景,就需要运用大量场景化
    的头像 发表于 05-28 14:22 807次阅读
    标贝<b class='flag-5'>数据</b>采集标注在<b class='flag-5'>自动驾驶</b>场景中落地应用实例

    特斯拉拟在华建数据中心,加速自动驾驶发展

    据知情人士透露,特斯拉正计划在中国境内建立数据中心,此举是埃隆·马斯克全球自动驾驶战略的重要一环。新数据中心将专门用于训练自动驾驶车辆所需的先进算法,以推动全球
    的头像 发表于 05-20 10:12 507次阅读

    未来已来,多传感器融合感知是自动驾驶破局的关键

    /L4级自动驾驶赛跑的元年。 马斯克评论FSD 12.3版本的左转弯操作就像人类司机一样。如果FSD 12.3版本成功,将基本颠覆目前市场上的智能驾驶技术路线。基于“数据/算法/算力”的无人
    发表于 04-11 10:26