0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

京东众智专注于人工智能数据标注和采集的科技平台

电子工程师 来源:未知 作者:李倩 2018-06-14 09:17 次阅读

数据标注是人工智能进行模型训练必不可少的一环。这是将最原始的数据变成算法可用数据的过程:原始数据一般通过数据采集获得,随后的数据标注相当于对数据进行加工,然后输送到人工智能算法和模型里进行调用。

上述概念阐释的背后实际上潜藏着一个正在茁壮成长的商业机会,尤其随着AI行业的发展,优质数据甚至可能是公司发展的壁垒。

按照人员规模,现在的数据标注行业分为小型工作室(20 人左右)、中型公司以及巨头企业。它们之间有各自的短板:专业的数据标注、采集小团队没有标注工具,开始逐渐向拥有更好技术资源的大平台靠拢。与之形成对比的是,花费巨大资源打造专业全职标注团队的数据公司,却也受困于人力成本不得不把一些业务外包给小团队。

诸如巨头企业,虽然在努力搭建平台,但一方面更多是以消化内部需求为主,另一方面在人员培训和质量管控上,更多是流程化操作,缺乏合理的运营模式。

“没有一个标准。”基于上述的调研结果,在京东金融众智平台项目负责人看来,数据标注行业比较混乱。

在这种行业状况下,京东金融要做一个“中立”平台,成为需求方和最终标注团队之间的连接者:为小型工作室提供标注工具,同时也对需求方提供数据标注方案。

“京东众智”就是这样一个产物,它是专注于人工智能数据标注和采集的科技平台。上述负责人特意强调了“科技”二字,这意味着该平台并不是传统的众包模式,而是通过自身的科技能力,优化标注流程,提升标注效率,保证标注质量。

“大部分算法在拥有足够多的普通标注数据的情况下很容易将准确率提升到 95%,但从 95% 再去提升到 99% 甚至 99.9% 就需要大量高质量的标注数据。可以说,高质量的数据是制约模型和算法突破瓶颈的关键指标。”

京东众智的科技能力恰好表现在提高标注质量、提升标注速度、降低标注成本以及保证数据安全四个方面。

标注质量为先,而它又与标注人员息息相关。针对专业标注人才培养的流程,他们甚至要跟一些公司建立数据标注师认证标准,对不同人员评估其标注等级。这符合京东众智“三擎互驱”的理念:让最专业的人用最专业的工具,在严谨的工作流程中完成数据的标注,并且由选拔出来的高水平专家进行审核,保证正确率。

准确率与客户的要求也有很大关系,比如众智平台的图片标注准确率在实测状态下能达到 99%,为了确保准确性,他们有 ACC 和抽检等四层过滤流程。

在保证数据标注质量的前提后就要比拼标注速度了。

当下 AI 解决方案落地速度普遍较慢。“传统的方式是有 AI 需求,然后需要先获取样本数据进行数据标注,标注之后再做模型训练。”但在数据标注之后如果不满意,还需要把数据返回重新优化,上述负责人表示,这样的方式导致从方案确认到落地可能需要 1 个月甚至时间更长。

众智平台的标注工具很大程度上提升了标注速度。“鲁班模板标注工具”可以组件化去配置。如果不同的公司对标注数据有不同需求,他们只需调整几个组件的配置就可以完成操作。

京东众智 Pre-AI 方案与传统方案的对比

更重要的是京东众智提出的“Pre-A.I”方案。此方案在标注过程中会不断添加智能元素,机器做预标注,标注人员只需在此基础上做细微的调整即可。

这些技术的应用在很大程度上节省了标注时间,而在 AI 市场竞争激烈的环境中,速度对创业公司而言尤为重要。“原来完整的标注流程如果是 1 个月的话,我们可能 3、4 天就可以交付了。”该负责人如此评估众智平台的标注效率。

数据标注速度提升的直接结果是标注成本自然会降低。不过,在行业一片混乱的数据运营模式下,数据安全是需求方最为关注的问题。

对于政府、银行等企事业单位而言,它们担心数据被转手,一般要求数据必需在自己的环境内进行标注。为此,他们提供了数据与流程分离方案。数据与流程分离方案针对客户自有标注平台和客户没有标注平台两种情况。

京东众智 DCS 方案流程

对那些数据标注需求比较大的大公司,众智平台可以打通京东金融和客户两者的标注平台,同时为标注流程有严格的质量把控。需要注意的是,标注环境实际上还是在客户环境下。对于没有标注平台的客户,京东金融提供了一套名为“众智星”的标注系统,它可以让数据不出客户环境就能完成数据标注。

据负责人介绍,该平台已于去年 8 月正式上线。目前平台上数据标注注册人员在 3 万以上,而数据采集的注册人员更是超过了 10 万人。

“京东众智旨在为 AI 行业提供最优质的基础数据,希望在不久的将来,国内大部分的 AI 公司都可以使用我们提供的高质量标注数据训练出更优质的模型和算法。这些模型和算法不仅要服务国内的用户,更要把中国的 AI 能力服务于全世界。为全球的人工智能行业助力是我们的初心。”负责人如是说。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46872

    浏览量

    237608
  • 京东
    +关注

    关注

    2

    文章

    995

    浏览量

    48421

原文标题:听说数据标注行业缺“中立”平台,京东金融竖起了大旗

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    嵌入式和人工智能究竟是什么关系?

    应用场景。例如,在智能家居领域,嵌入式系统可以控制各种智能设备,如智能灯泡、智能空调等,而人工智能则可以实现对这些设备的
    发表于 11-14 16:39

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得一好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应用。这一章详细
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    很幸运社区给我一个阅读此书的机会,感谢平台。 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们揭示了人工智能技术在生命科学领域中的广泛应用和深远影响。在
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    周末收到一本新书,非常高兴,也非常感谢平台提供阅读机会。 这是一本挺好的书,包装精美,内容详实,干活满满。 《AI for Science:人工智能驱动科学创新》这本书的第一章,作为整个著作的开篇
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    RISC-V在人工智能图像处理领域的应用前景十分广阔,这主要得益其开源性、灵活性和低功耗等特点。以下是对RISC-V在人工智能图像处理应用前景的详细分析: 一、RISC-V的基本特点 RISC-V
    发表于 09-28 11:00

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟按照要求准备相关体会材料。看能否有助于入门和提高ss
    发表于 09-09 15:36

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    活的世界? 编辑推荐 《AI for Science:人工智能驱动科学创新》聚焦人工智能与材料科学、生命科学、电子科学、能源科学、环境科学五大领域的交叉融合,通过深入浅出的语言和诸多实际应用案例,介绍了
    发表于 09-09 13:54

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    呈现、产业展览、技术交流、学术论坛一体的世界级人工智能合作交流平台。本次大会暨博览会由工业和信息化部政府采购中心、广东省工商联、前海合作区管理局、深圳市工信局等单位指导,深圳市人工智能
    发表于 08-22 15:00

    FPGA在人工智能中的应用有哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 一、深度学习加速 训练和推理过程加速:FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性
    发表于 07-29 17:05

    夏普讨论建立人工智能数据中心

    近日,夏普公司宣布与KDDI公司达成重要合作意向,双方将针对建立人工智能数据中心进行深入讨论。据悉,此次合作将围绕英伟达的人工智能计算平台和Supermicro
    的头像 发表于 06-05 09:17 446次阅读

    标贝数据采集标注在自动驾驶场景中落地应用实例

    AI数据服务作为人工智能和机器学习的基础,在自动驾驶领域中有着重要地位。与其他人工智能应用场景相比,自动驾驶的落地场景相对复杂,想要让汽车本身的算法做到处理更多、更复杂的场景,就需要运用大量场景化
    的头像 发表于 05-28 14:22 472次阅读
    标贝<b class='flag-5'>数据采集</b><b class='flag-5'>标注</b>在自动驾驶场景中落地应用实例

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V2)

    32秒 https://t.elecfans.com/v/27222.html *附件:5G AIoT技术实践入门与探索_V2_20240416.pdf 人工智能 AIMO模型优化平台介绍 2分20秒
    发表于 05-10 16:46

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V1)

    .pdf 人工智能 软件平台使用指导A:AidLux平台介绍 8分29秒 https://t.elecfans.com/v/25505.html *附件:AidLux平台使用介绍.pd
    发表于 04-01 10:40

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能领域布局
    发表于 02-26 10:17

    Cognizant推出支持生成式人工智能的新平台

    Cognizant,全球领先的信息技术服务公司,近日宣布推出一个革命性的平台——Cognizant Flowsource,旨在为企业提供下一代软件工程解决方案。该平台专注生成式
    的头像 发表于 02-03 16:11 756次阅读