0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分析:AI人工智能基础数据服务行业发展概况及方向

如意 来源:百家号 作者:鹏澜财经 2020-06-23 11:17 次阅读

一、AI 基础数据服务行业简介

AI产业对训练数据的需求主要来源于成熟 AI算法模型的拓展性需求和新生AI算法模型的前瞻性需求。在成熟的拓展性需求方面,麦肯锡的研究报告表明:深度学习模型对训练数据的数据量、多样性和更新速度方面提出较高要求。

为充分发挥人工智能技术的潜能,深度学习模型需要海量且涵盖图像、视频及语音在内等多种类型的训练数据进行模型训练。此外,人工智能技术要求算法模型根据潜在的应用场景变化而持续更新,因此,人工智能算法模型所使用的训练数据亦需要定期更新。具体而言,约 1/3 的算法模型每月至少更新一次,约 1/4 的算法模型每日至少更新一次,人工智能算法模型持续更新的特点将进一步拓展各领域训练数据的需求空间。

而在新生的前瞻性需求方面,随着人工智能商业化进程的演进,新兴 AI 应用场景如智联网 AIoT、AI PaaS、产业互联网等将展现出巨大的发展潜力,并逐步促进 AI 技术和算法模型的优化和创新。

因此,在创新应用场景和新型算法的带动下,具有前瞻性的训练数据产品和高定制化的训练数据服务需求将逐步成为主流。

二、全球 AI 基础数据服务行业的发展情况

全球 AI 基础数据服务行业处于快速成长期,市场规模具有较大的增长空间。AI 应用场景的创新和机器学习算法的流行直接带动了训练数据需求的大幅增长,这种趋势导致 AI 训练数据难以获取和数据科学家、数据工程师等人力资源稀缺成为制约 AI 产业发展的两大挑战。

根据 Dimensional Research 的全球调研报告,72%的受访者认为至少使用超过10 万条训练数据进行模型训练,才能保证模型有效性和可靠性,96%的受访者在训练模型的过程中遇到训练数据质量不佳、数量不足、数据标注人员不足等难题。

为应对 AI 训练数据所带来的多方面挑战,AI 企业开始从第三方购买原料数据收集、训练数据生产和数据专家咨询等服务,调研结果指出,外包服务能够有效加快算法模型落地应用的速度。

因此,得益于训练数据需求增长和 AI 企业训练数据对外采购意识的形成,全球 AI 基础数据服务行业进入快速成长期,市场规模具有较大的增长潜力。

三、中国 AI 基础数据服务行业市场规模

从 AI 产业链的发展情况和未来发展趋势来看,中国 AI 基础数据服务行业的市场规模将不断扩大。

一方面,随着算法模型、技术理论和应用场景的优化和创新,AI 产业对训练数据的拓展性需求和前瞻性需求均快速增长;

另一方面,随着行业内对训练数据需求类型的增加以及对服务标准要求的提高,AI 产业链的专业化分工将愈加清晰,专业化的训练数据服务提供商将在 AI 产业链上的扮演更加重要的角色。

根据艾瑞咨询《2020 年中国 AI 基础数据服务行业发展报告》,2019 年中国 AI基础数据服务行业的市场规模达到 30.9 亿元,预计 2025 年市场规模将突破100 亿元,年均复合增长率达到 21.8%。

四、中国 AI 基础数据服务行业市场规模增长的驱动因素

随着 AI 基础数据服务行业的市场规模增速平稳向上,增量市场将替代存量市场成为主要拉力。

从需求方的角度看,AI 基础数据服务市场可以分为存量市场和增量市场:

存量市场是指训练数据服务行业已有并且稳定的业务范畴,如人脸识别、车辆识别、图片识别、语音识别等相关业务,增量市场是指海外业务、新增需求方、新增业务场景等。在存量市场中,巨头互联网科技公司和 AI 公司为主要需求方,项目落地所需的训练数据逐渐成为需求核心,目前存量市场仍是 AI基础数据服务市场的需求主体。

增量市场是相对于存量市场而存在的,以海外市场、国内新需求方市场、国内新兴业务拓展和国内新成立的 AI 创业公司的需求为主,目前增量市场对于整体市场规模的贡献率较低,但随着中国 AI 技术的不断深入与国际化,增量市场将在未来成为主要的拉动力量。 AI 基础数据服务行业市场规模增长的驱动因素可以分为外部因素和内部因素。

在外部因素方面,AI 产业支撑体系方面的政策支持、投资机构的资金投入、科技巨头企业的 AI 生态链布局将推动 AI 基础数据服务行业加速发展。

在内部因素方面,现阶段有监督的深度学习算法的广泛应用为 AI 基础数据服务行业带来稳定的市场需求,未来 AI 新场景、新模式、新业态的不断涌现将对训练数据的数量和类型提出更高的要求,为 AI 基础数据服务行业带来源源不断的新生市场需求。

五、中国 AI 基础数据服务行业业需求类型

按数据类型划分,中国 AI 基础数据服务行业的市场需求可以分为图像类数据需求、语音类数据需求和自然语言处理类数据需求。

2019 年,图像类、语音类和自然语言处理类数据需求规模占比分别为 49.7%、39.1%和 11.2%。

六、中国 AI 基础数据服务行业的产业链情况

中国 AI 基础数据服务行业产业链:

上游包括数据生产者和数据生产组织者,主要提供原料数据的采集服务;

中游包括 AI 基础数据服务商,主要通过数据处理能力和项目管理能力完成训练数据集结构设计、数据加工和质量检测等工作,为下游客户提供训练数据产品和相关服务;

下游包括科技公司、行业企业、AI 公司和科研单位,主要负责 AI 算法研发。

七、中国 AI 基础数据服务行业的市场参与主体

当前,中国 AI 基础数据服务行业的市场参与主体主要包括下述几类:

一是学术机构,为开展相关研究工作,自行采集、标注,并建设学术训练资源库。这类训练数据主要用于算法的创新性验证、学术竞赛等,但通常其迭代速度较慢,难用于实际应用场景。

二是政府等中立机构,他们以公益形式开放的公共数据,主要包括政府、银行机构等行业数据及经济运行数据等,数据标注一般由使用数据的机构完成。

三是需求方自建基础数据团队,需求方科技公司或 AI 公司等为开展业务而自行建设训练资源库,一般自行采集、标注形成自用训练数据,或采购专业数据公司提供的数据外包服务。

四是 AI 基础数据服务商,依据业务规模可以进一步分为品牌数据服务商和中小数据供应商。这类公司业务包括出售现成训练数据集的使用授权,或根据用户的具体需求提供数据处理服务(企业自行采集或用户提供原始数据、企业对数据进行转写、标注),具体业务服务形式包括且不限于提供训练数据产品、提供数据采集服务、提供数据转写标注服务等。

八、中国 AI 基础数据服务行业的竞争格局

在上述的参与主体中,品牌数据服务商、中小数据供应商和需求方自建基础数据团队构成市场竞争关系,为 AI 基础数据服务市场的主要供应方,在 2019 年AI基础数据服务市场规模中的份额占比分别为 30.4%、47.0%和 22.6%,目前中小数据供应商是市场中的主要供应力量。

资料来源:艾瑞咨询

从供应方的发展来看,行业内部处于“洗牌”阶段,未来品牌数据服务商阵营将替代中小型供应商阵营,占据市场的主要份额。

目前,中小型数据供应商的整体体量仍然可观,但随着业务门槛提升、客户需求多样化、价格战中利润被压缩等情况成为常态,越来越多的中小型数据供应商面临经营困境,所占市场份额将呈现持续缩小的趋势。

艾瑞咨询的数据显示,2019 年中小型数据供应商份额比预期值缩小了 20.8%,而这部分份额按 7:3 的比例向品牌数据服务商和需求方自建基础数据团队释放,因此,品牌数据服务商将在行业内部调整阶段获益最多。

九、行业发展态势

1 需求方对 AI 训练数据的要求向精细化转型

在行业发展初期,AI 基础数据服务行业的门槛较低,玩家鱼龙混杂,行业标准模糊,服务质量参差不齐。随着 AI 产业落地成为主旋律、行业整体竞争愈发激烈,需求方对训练数据质量的要求不断提高,垂直场景的定制化训练数据需求成为主流,需求方市场对 AI 训练数据的要求逐渐向精细化转型。

需求方对 AI 训练数据的精细化需求主要体现在两方面:

一方面,人工智能 算法应用要经历研发、训练和落地三个阶段,需求方根据算法应用的不同阶段对 AI 训练数据提出差异化需求:研发需求是对新拓展领域或新建算法的训练,对数据数量的要求较高,但数据标注内容倾向于标准化;训练需求一般是对算法的准确性和健壮性进行优化,对数据标注的内容需求较为丰富,对数据准确性要求较高;落地需求一般为算法较成熟的核心场景,对训练数据的内容有特定指向,采标难度较大,同时对 AI 基础数据服务商的技术能力、服务意识、稳定性和效率有较高要求。随着人工智能技术的发展及与应用场景的深入结合,训练需求和落地需求逐渐成为主流。

另一方面,需求方对 AI 基础数据服务商的数据安全、采标能力、数据质量、管理能力、服务能力等核心能力提出了更高的要求:在数据安全方面,需求方对数据授权、数据传输、存储及结项后的数据销毁等环节更加重视;在采标能力方面,需求方更关注服务商在某些特定领域或垂直场景的采集能力、定制研发标注工具的能力以及对项目需求的理解程度;在数据质量方面,需求方对首次交付的准确率提出更高要求;在管理能力方面,需求方注重服务商 的项目管理能力、服务效率以及执行团队的素养与信誉;在服务能力方面,需求方希望 AI 基础数据服务商具备快速响应能力和主动服务意识。

2 中小型数据供应商市场份额缩小,品牌数据服务商价值凸显

由于目前 AI 基础数据服务行业对劳动力存在密集型需求,人力输送和项目转包等服务形式仍然存在,因此中小型数据供应商仍占有一定的市场份额。但随着业务门槛提升、客户需求向精细化转型,众多中小型数据供应商在数据质量和采标能力方面达不到相关要求,将逐渐远离“利润中心”,面临被淘汰或被整合的局面。

根据《行业研究报告》,2019 年人工智能中小型数据服务商市场份额比预期值缩小 20.8%,相应市场份额按 7:3 的比例向品牌数据服务商和需求方自建基础数据团队转移,因此品牌数据服务商将获得大部分“红利份额”,商业价值逐步凸显。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29925

    浏览量

    268219
  • 人工智能
    +关注

    关注

    1791

    文章

    46736

    浏览量

    237293
收藏 人收藏

    评论

    相关推荐

    标贝科技:AI基础数据服务人工智能行业发展的底层支撑

    随着不同大模型在语言理解及生成等领域的出色表现,大模型别后的规模规律不断强化数据在要提升AI性能上的关键作用,AI数据服务可加速高质量数据
    的头像 发表于 11-14 18:32 125次阅读
    标贝科技:<b class='flag-5'>AI</b>基础<b class='flag-5'>数据服务</b>,<b class='flag-5'>人工智能行业</b><b class='flag-5'>发展</b>的底层支撑

    嵌入式和人工智能究竟是什么关系?

    人工智能的结合,无疑是科技发展中的一场革命。在人工智能硬件加速中,嵌入式系统以其独特的优势和重要性,发挥着不可或缺的作用。通过深度学习和神经网络等算法,嵌入式系统能够高效地处理大量数据
    发表于 11-14 16:39

    DEKRA德凯亮相苏州市检验检测认证服务行业沙龙

    近日,苏州市场监管局成功举办检验检测认证服务行业沙龙活动。活动旨在通过行业间的深入交流和合作,推动苏州制造业的高质量发展和国际化认证进程。DEKRA德凯亚太区高级副总裁、中国大陆及香港董事总经理
    的头像 发表于 11-14 13:50 107次阅读

    AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    、优化等方面的应用有了更清晰的认识。特别是书中提到的基于大数据和机器学习的能源管理系统,通过实时监测和分析能源数据,实现了能源的高效利用和智能化管理。 其次,第6章通过多个案例展示了
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    阅读这一章后,我深感人工智能与生命科学的结合正引领着一场前所未有的科学革命,以下是我个人的读后感: 1. 技术革新与生命科学进步 这一章详细阐述了人工智能如何通过其强大的数据处理和分析
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    人工智能在科学研究中的核心技术,包括机器学习、深度学习、神经网络等。这些技术构成了AI for Science的基石,使得AI能够处理和分析复杂的
    发表于 10-14 09:16

    AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    RISC-V在人工智能图像处理领域的应用前景十分广阔,这主要得益于其开源性、灵活性和低功耗等特点。以下是对RISC-V在人工智能图像处理应用前景的详细分析: 一、RISC-V的基本特点 RISC-V
    发表于 09-28 11:00

    人工智能ai 数电 模电 模拟集成电路原理 电路分析

    人工智能ai 数电 模电 模拟集成电路原理 电路分析 想问下哪些比较容易学 不过好像都是要学的
    发表于 09-26 15:24

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟
    发表于 09-09 15:36

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    大力发展AI for Science的原因。 第2章从科学研究底层的理论模式与主要困境,以及人工智能三要素(数据、算法、算力)出发,对AI
    发表于 09-09 13:54

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    8月28日至30日,2024深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会将在深圳国际会展中心(宝安)举办。大会以“魅力AI·无限未来”为主题,致力于打造全球通用人工智能
    发表于 08-22 15:00

    嵌入式热门发展方向有哪些?

    感器网络数据的实时分析数据融合及预警服务。在智慧工厂及工业自动化方面,嵌入式人工智能可以改进传统的工业生产模式,提升生产能力及优化工厂运行
    发表于 04-11 14:17

    嵌入式人工智能的就业方向有哪些?

    。 国内外科技巨头纷纷争先入局,在微软、谷歌、苹果、脸书等积极布局人工智能的同时,国内的BAT、华为、小米等科技公司也相继切入到嵌入式人工智能的赛道。那么嵌入式AI可就业的方向有哪些呢
    发表于 02-26 10:17

    2023年人工智能产业概况及应用趋势分析

    电子发烧友网站提供《2023年人工智能产业概况及应用趋势分析.pdf》资料免费下载
    发表于 12-11 16:27 7次下载
    2023年<b class='flag-5'>人工智能</b>产业<b class='flag-5'>概况</b>及应用趋势<b class='flag-5'>分析</b>