0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是数据标注?数据如何标注?

倩倩 来源:今日头条 2020-07-17 09:39 次阅读

数据标注是大多数人工智能的基础,它决定了机器学习深度学习模型的质量。今天的数据呈现指数级的爆发,比如仅在2018年,就产生了超过30 ZB的数据。而在在任何人工智能项目中,对于数据科学家而言,数据问题都是其中的症结所在。

什么是数据标注?

训练机器学习和深度学习模型,需要丰富的数据,以便将其用于部署,训练和调整模型。训练机器学习和深度学习模型需要大量经过仔细标注的数据。标注原始数据并准备将其应用于机器学习模型和其他AI工作流,被称为数据标注。根据相关统计,数据整理在AI项目中消耗了80%以上的时间。

数据如何标注?

如今,大多数数据都没有标注。带标签的数据,意味着标注或注释目标模型的数据,以便可以预测。通常,数据标注包括数据标注,注释,审核,分类,转录和处理。

标注的数据突出显示某些特征,并根据这些特征对其进行分类,可以通过模型分析其模式以预测新的目标。例如,对于自动驾驶汽车中的计算机视觉,AI专业人员或数据标注者可以使用视频标注工具来指示路牌的位置,并通过行人和其他车辆的位置来训练模型。

数据标注中包含的一系列任务:

丰富数据的工具

质量保证

流程迭代

管理数据标签

培训新的数据标签

项目计划

成功指标

流程运作

AI专业人员的数据标签挑战?

在典型的AI项目中,专业人员在进行数据标注时会遇到以下几个方面的挑战。

数据标签质量低下。数据标签质量低可能有很多原因。其中最突出的原因之一是任何企业或工作流程确实三个决定因素:人员,流程和技术。

无法扩展数据标注操作。当数据量不断增长并且业务或项目需要扩展其容量时,由于大多数企业都在内部标记数据,因此它们通常也难以扩展其数据标注任务。

难以承受的成本和不存在的结果。企业和AI项目经理通常雇用高薪数据科学家和AI专业人士或一组业余人员来处理数据标签,而企业需要承担高昂的人工成本,当然企业也会面临数据标签不确定所带来的问题,所以合适的专业人员至关重要。

质量保证。进行质量检查可以为数据标注过程提供重要价值,尤其是在机器学习模型测试和验证的迭代阶段。

谁来标注数据?

相关调查显示,2019年,企业在数据标签上的支出超过17亿美元。到2024年,这一数字将达到41亿美元。进行数据标注工作,除了雇佣专业的数据科学家和AI专家之外,还可以考虑通过其他方式。

雇员。这包括雇用包括AI专业人员在内的全职或兼职员工,参与AI项目的各个方面,其中之一是数据标注。

托管团队。他们是经验丰富,且训练有素的数据标签团队。

承包商。他们包括自由职业者和临时工。

众包。企业可以使用第三方平台一次性寻找数据标注团队。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46840

    浏览量

    237519
  • 计算机视觉
    +关注

    关注

    8

    文章

    1696

    浏览量

    45927
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120970
收藏 人收藏

    评论

    相关推荐

    标贝科技:自动驾驶中的数据标注类别分享

    的必要条件,数据采集、数据标注服务已成为支撑自动驾驶热潮必不可少的一环。本文将以数据标注的视角,通过标贝科技自研平台标贝
    的头像 发表于 11-22 15:07 330次阅读
    标贝科技:自动驾驶中的<b class='flag-5'>数据</b><b class='flag-5'>标注</b>类别分享

    标贝科技:自动驾驶中的数据标注类别分享

    的必要条件,数据采集、数据标注服务已成为支撑自动驾驶热潮必不可少的一环。本文将以数据标注的视角,通过标贝科技自研平台标贝
    的头像 发表于 11-22 14:58 78次阅读
    标贝科技:自动驾驶中的<b class='flag-5'>数据</b><b class='flag-5'>标注</b>类别分享

    工具型AI标注平台SpeedDP工作流程是怎样的?

    SpeedDP作为一个工具型AI平台,它能提供从数据标注、模型训练、测试验证到RockChip嵌入式硬件平台模型部署的可视化AI开发功能。平台所需算法并不是固定的,使用者可以根据自身实际应用场景进行
    的头像 发表于 11-19 01:02 190次阅读
    工具型AI<b class='flag-5'>标注</b>平台SpeedDP工作流程是怎样的?

    HarmonyOS NEXT应用元服务开发按钮标注场景

    对于用户可点击等操作的任何按钮,如果不是文本类控件,则须通过给出标注信息,包括用户自定义的控件中的虚拟按钮区域,否则可能会导致屏幕朗读用户无法完成对应的功能。 此类控件在进行标注时,标注文本不要包含
    发表于 10-10 16:48

    蚂蚁数科发布AI赋能新一代数据标注产品

    在近日举行的2024 Incluison·外滩大会上,蚂蚁数科凭借其技术创新的深厚底蕴,正式推出了新一代AI数据标注产品,旨在为企业客户提供全方位、智能化的数据解决方案。这款产品的问世,标志着蚂蚁数科在AI
    的头像 发表于 09-10 16:04 398次阅读

    SpeedDP! 超便利AI自动图像标注工具 功能丰富、省时省力

    使用者快速进行人、车、船等数据集的一键标注。SpeedDP依靠YOLO系列算法来检测模型,实现“一键标注”和“目标检测”,并且还提供丰富的算法参数设置接口,满足不
    的头像 发表于 08-30 12:59 243次阅读
    SpeedDP! 超便利AI自动图像<b class='flag-5'>标注</b>工具   功能丰富、省时省力

    你了解贴片电感上标注的数字含义吗?

    你了解贴片电感上标注的数字含义吗?
    的头像 发表于 08-17 14:30 582次阅读
    你了解贴片电感上<b class='flag-5'>标注</b>的数字含义吗?

    车载语音识别系统语音数据采集标注案例

    的作用。一般来说,车载语音识别系统主要分为前端和后端两个部分,本文将针对前端语音信号数据采集标注进行实例讲解。
    的头像 发表于 06-19 15:52 322次阅读
    车载语音识别系统语音<b class='flag-5'>数据</b>采集<b class='flag-5'>标注</b>案例

    车载语音识别系统语音数据采集标注案例

    的作用。一般来说,车载语音识别系统主要分为前端和后端两个部分,本文将针对前端语音信号数据采集标注进行实例讲解。
    的头像 发表于 06-19 15:49 463次阅读

    标贝数据采集标注在自动驾驶场景中落地应用实例

    高质量AI数据做支撑。标贝科技深耕AI数据服务领域多年,在自动驾驶数据采集标注领域中有着多个成功案例,在自动驾驶场景中,数据采集和
    的头像 发表于 05-28 14:22 469次阅读
    标贝<b class='flag-5'>数据</b>采集<b class='flag-5'>标注</b>在自动驾驶场景中落地应用实例

    慧视SpeedDP大模型打造图像标注新时代

    在人工智能时代,图像标注不仅能够反哺AI的发展,还能进一步降低项目成本。传统的图像标注需要人工采用文本或者相应工具机械式的进行图像标签分配,例如谷歌就曾大量使用图像验证码,用户在进行验证码点击的时候
    的头像 发表于 05-24 08:29 507次阅读
    慧视SpeedDP大模型打造图像<b class='flag-5'>标注</b>新时代

    人工图像标注1~2分钟,SpeedDP仅需7-8毫秒!降本增效不是梦!

    在工作中你有没有遇到这样的问题,20万拿下一个项目,时间紧迫,但是项目有着大量的图像标注需求,如果单独招一个图像标注的工程师,光该岗位的工资成本就会花去四五万,毕竟项目结束了你总不能就把人裁了。但
    的头像 发表于 03-29 08:28 525次阅读
    人工图像<b class='flag-5'>标注</b>1~2分钟,SpeedDP仅需7-8毫秒!降本增效不是梦!

    led发光模块的地线可以标注为什么

    LED发光模块是一种常见的电子元件,用于将电能转化为光能。地线是模块中一个重要的接线点,起到连接模块与地面的作用,以确保电路的正常工作。本文将详细介绍LED发光模块的地线标注的原因和意义,以及
    的头像 发表于 01-24 14:53 760次阅读

    利用AI实现自动图像标注不是梦

    一次次的将图像添加标签进行分类,如此机械式的操作是否令你心烦?为不多不少的图像分类标注工作不得不增加一个岗位?你是否因图像标注需求和数据安全不可兼得而苦恼?为了解决这些市场需求和困境,慧视光电研发
    的头像 发表于 01-04 08:29 1241次阅读
    利用AI实现自动图像<b class='flag-5'>标注</b>不是梦

    图像标注如何提升效率?

    图像标注是通过一定方式对图像进行标记分类,是对数据集的图像进行标记以训练机器学习模型的过程。当图像数量可控时,用人工标注就可以很快完成任务,但当有海量的图像信息待标注时,长时间的重复动
    的头像 发表于 12-19 08:29 436次阅读
    图像<b class='flag-5'>标注</b>如何提升效率?