智能影像技术的发展历程,智能影像生产技术的发展现状-电子发烧友网

近日，Forrester咨询公司对中国计算机视觉及智能影像市场进行了调查，访问了包括研究机构、科研院校、投资机构以及部分互联网企业，视频行业企业，针对以视频行业为代表的文娱产业中人工智能的应用趋势、面临的挑战进行了分析，并提出相应的战略建议。

网易智能节选整理如下：

近年来，在互联网、大数据、超级计算、传感网、脑科学等新理论、新技术以及经济社会发展强烈需求的共同驱动下，人工智能呈现出飞跃式的进步，进入新的发展阶段。无论是企业还是政府在人工智能方面的关注和投入，都在不同层面推动着人工智能技术和应用的蓬勃发展。各种创新的AI应用逐步开始进入社会生活的各个场景。

同时，我们也看到，新兴科技正在推动新一轮全球产业变革，而人工智能毫无疑问成为了释放产业变革潜能的重要力量。作为人工智能技术的重要分支，计算机视觉技术在算法、数据及算力的加持下，更是得到了飞速的发展，已经具备大规模应用的可行性。特别是在文娱产业得到了广泛应用的智能影像技术已经成为行业变革的核心驱动力，将进一步催生新应用、新产品、新产业、新业态、新模式的出现，推动智能影像产业生态的繁荣。

调查结果摘要

人工智能为影像分析技术带来变革。人工智能在影像行业的综合应用，特别是通过对动态视觉内容的理解和重构，是计算机视觉技术及计算机动画技术的交叉和融合，给智能影像产业带来了充满想象力的广阔舞台和空间。

智能影像技术为产业变革带来强劲动力。过去几年文娱产业经历了快速的发展，以内容制作方、视频平台方为代表行业参与者正面临着诸多的挑战，各方仍在行业变局中摸索前行，期望不断通过运用新兴技术和应用的创新提升自身的核心竞争力。智能影像技术在行业的应用日渐深入，成为新一轮行业变革的核心驱动力。

把握数字化转型新契机，智能影像技术加速业务变革。智能影像技术不仅成为文娱产业商业价值变现的核心引擎，也在逐渐进入更多的内容原创领域，通过自动化影像加工、生产技术为产业升级提供动力。而且，智能影像技术也通过全面赋能推动应用在教育、零售等更多领域落地，成为行业价值创新的基石。

深耕行业场景，聚焦价值创造，拓展行业生态。智能影像技术企业需要聚焦行业实践、商业价值闭环，以及开放性平台技术，推动智能影像行业的协同发展和生态的进一步繁荣。

智能影像技术的发展历程

2006年以来，随着深度学习技术的进展，人工智能再次获得了广泛关注。特别在图像领域，深度学习带来的突破性效果在很多领域已经超过人类水平，各种类型的神经网络不断涌现，伴随着计算力的提升以及海量数据的积累，人工智能为广阔的图像分析领域带来深刻变革。资本市场对与计算机视觉的热度空前高涨。

根据Forrester统计，全球在计算机视觉领域的投资持续增长，截止到2018年11月末投资较2017年增长113%，在过去的五年中复合增长率高达135%，在本次访谈调研中了解到，未来五年内全球计算机视觉软件及服务市场规模将超过200亿美金。

影像相关的市场规模相当可观，人工智能技术的赋能将会催生更多商业场景，进一步推动整体市场繁荣。在众多细分领域中，智能影像生产技术直接从源头上提高了视频影像的生产能力。除了与影像源头密切相关的文娱产业，智能影像还将赋能广告营销、教育、游戏、零售乃至制造等相关行业。

影像生产技术以计算机视觉（Computer Vision）与计算机图形学为基础。计算机视觉诞生于上世纪六十年代，是指能够赋予机器自然视觉能力的学科，关注图像的识别和分割。在初步兴起的二十年时间里，“识别”领域进展有限，而分割领域取得了一定的进展。进入本世纪，随着互联网的不断发展，图片的来源日趋丰富，各类图像数据库开始出现，标注数据进一步促进计算机视觉的发展。

在深度学习广泛应用之前，视觉算法一般分为：特征感知、图像预处理、特征提取、特征筛选、推理与识别。手工设计特征需要对相关领域具有足够的积累和经验，对于提取的特征还需要进行大量调试工作。不同的特征对应的后端机器学习算法也有所不同。二者组合起来，通用性差而且需要投入大量工程性工作，进展缓慢且效果不佳，与人类水平有很大差距，迟迟难以大规模商用，对于图像之外的多模态感知识别更是困难重重。

计算机图形学（Computer Graphics）是指在计算机上用专门的软件和硬件用来表现和控制图像数据，它同样诞生于上世纪六十年代。自诞生之初开始即开始踊跃发展，分形理论、曲面造型技术、光栅图形学算法、光照模型、光线追踪算法、辐射度算法等技术手段陆续被提出。80年代中期，皮克斯使用SGI计算机创作了第一段完全用计算机生成的短片。1995年首部计算机生成的动画影片《玩具总动员》全球上映，1996年最早的全三维游戏《雷神之锤》发售。

一些事实标准的出现，如SGI公司开发的OpenGL开放式三维图形标准，微软公司的标准接口DirectX，Adobe公司的Postscript等，进一步加速了影像生产的产业化进程。但是，影像生产中大量人工仍然不可避免，具体到面向大众的个性化影像生产而言，重复性的人力劳动已经严重制约了产能，亟需智能化、自动化的影像生产技术推动产业的升级。

智能影像生产技术的发展现状

Forrester对人工智能技术进行分类研究时采用了Sense、Act、Think的框架。类比来看，在感知（Sense）层面，人工智能技术为静态图片识别乃至多模态影像识别带来了突破；在思考（Think）层面，基于多模态识别结合商业需求可以形成深入的影像智能化理解。以感知、思考为基础，在行动（Act）层面，人工智能技术为自动化影像生产带来了强劲动力。为此，我们将智能影像生产技术分为两部分：影像智能化理解(Sense和Think)和影像自动化生成（Act）。

传统的计算机视觉技术大量聚焦在特征生成和选择。端到端深度学习带来了自动特征学习能力，从而极大促进了计算机视觉的发展。深度学习所需的大量训练数据以及运算能力在当下也得到了良好的供应。对于“识别”这种人类无需思考即可在极短时间内作出判断的任务目前是人工智能最擅长的领域。从包括图像、语音、文字的多模态识别，人工智能对于影像感知和理解能力不断提升，推动了智能影像产业的快速发展。

此外，各种神经网络的组合为静态图像识别提供了有力武器。凭借着AlexNet在ILSVRC竞赛的一战成名，卷积神经网络（CNN）因其良好的泛化能力以及优秀的实际效果已经替代了众多传统计算机视觉算法，成为当前图像识别领域的主流。

在此基础上，ResNet、Inception、Xception、DenseNet、ShuffleNet等多种改良结构也不断涌现，推动了识别效果的进一步提高，在大规模人脸与人体识别、物体检测与追踪、3D视觉等领域都获得了广泛应用，已经达到了可以广泛实际落地的程度，甚至有的受访者表示这类任务的性能一定程度上已经达到饱和。

图像、语音、文本等多模态识别进一步丰富了影像识别能力。深度学习不仅赋能了计算机视觉领域，还为语音识别、文本分析领域带来突破。循环神经网络（RNN）及其变种LSTM在这些领域取得令人瞩目的进展而成为主流。以此为基础，各种增强技术如双向LSTM、Attention model等也开始得以广泛应用。深度学习的理论基础在“去黑盒化”的道路上已经取得进展，各种技术的组合为也不断刷新着各类任务的效果新高。多模态识别已成为计算机视觉和AI最令人激动的领域之一，现有感知能力甚至已经超出商业变现的步伐。寻找应用场景、促进技术落地的难度开始大于技术本身。

影像语义理解增加了商业模式的可能性。通过视频结构化分析、目标检测跟踪、动作态势感知、人物识别以及情感分析等多模态感知技术，人类已经可以从动态影像中获取浅层信息。但是要做到商业模式变现，仍需进一步从语义的层面深入理解影像内容。

在这一领域，需要有大量的行业积累，例如对综艺类视频节目中人物、物体等的识别标注，需要专业的经验，基于编剧、布景、拍摄等角度，对视频进行结构化建模进行分析和学习，把特征空间提升到语义空间。在此基础上对影像数据生成语义标签、业务分类乃至文字描述以供后续业务场景使用。常识的建立可以极大提升机器性能，既有经验与多种深度网络的融合将会形成企业差异化的竞争优势。

智能影像行业案例

Netflix：总部位于美国加州的Netflix成立于1997年，是一家在线影片服务提供商。Netflix以投入优质内容吸引用户，通过用户加入会员付费观看内容获取收入。但近年来面临新增用户增长放缓以及内容成本急剧攀升的压力，Netflix 2018Q2新增了447万国际用户和67万美国用户，低于Q1的500万和120万。随着用户对内容的要求越来越高，在线视频平台围绕优质内容进行竞争，内容正成为流量入口，Netflix也不例外，投入大量资源自己制作的内容，代表作包括《纸牌屋》，《怪奇物语》等。用户对视频形态也发生了变化，随着用户的观看视频的时间碎片化，短视频、倍速观看、跨屏看等等的个性化和自主化趋势对体验提出了更高挑战。

在这个挑战下，Netflix在继续加大对原创内容投入的同时，积极尝试并希望通过机器学习、神经网络和深度学习、计算机视觉等新兴AI技术，保持行业优势，优化内部运营。

Netflix尝试将人工智能应用在核心系统上，带来的直接效果就是付费用户超过1亿，推荐引擎提高3到4倍的点击率。同时，通过对视频及客户观影数据的分析，避免购买低收益的视频内容，累计已经实现了超过十亿美元的内容成本的节省。

影谱科技（Moviebook）：他们通过整合视频类渠道，覆盖了各硬件终端与计算机芯片、贯穿可视化场景，其智能影像生产技术具有批量自动化处理、子像素级分析、智能叠加和无痕展示等特征。

在人工智能业务领域，Moviebook通过Vedio AI制作引擎，实现影像内容生产制作的“从视频中捕获动作”Motion Capture from Video System（MCVS）框架。MCVS无需预先进行动作捕捉合成的高度结构化数据，就可以让机器直接模仿大量已存视频片段来学习高难度技能，允许数据为驱动的模仿以生成无监督学习视频内容。

该系统MCVS每天可以处理日常视频网络上的数百万端视频图像，提取关键帧，进行自动结构化，为下游任务提供大量数字化资源，如视频搜索、原生视频内容营销、视频内容创作、视频识别、游戏生产、在线教育等。

迪士尼：迪士尼研究院的一项内部研究,正在改变影片和VR的创作。过去,拍摄影片或开发一款VR游戏/内容,都需要先有剧本描述人物及场景等，但文字难以直观地描述复杂场景，这一步骤将耗费大量时间。为了在编写故事的过程中协助编剧，迪士尼开发了一个系统,可以从自然语言故事中提取信息，并允许以故事为中心以及以人物为中心的推理。这些推理功能通过直观的查询系统向创作人员开放，允许脚本编写者向系统询问有关故事和角色信息的问题,并形成可视化的动画或简单视频的展示，导演更直观地了解角色将如何在场景中进行表演,以及脚本的变化会怎样影响场景。

这项技术将应用在电影的创作和拍摄中，通过初步自动生成简单动画，进行现场整合及语音录制，然后戴上ⅤR头显直接在虚拟场景中进行预览，提供“亲临”影片故事场景的体验,制作人员还可移动预览场景中的虚拟人物角色的位置。这项技术将与迪士尼的数字影像、人工智能以及特效技术整合用于电影的创作制作以及后期过程。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
46838

浏览量
237496
计算机视觉

计算机视觉

+关注

关注
8

文章
1696

浏览量
45925
智能影像

智能影像

+关注

关注
0

文章
11

浏览量
3110

原文标题：计算机视觉及智能影像报告：未来规模超200亿美元

文章出处：【微信号：mcuworld，微信公众号：嵌入式资讯精选】欢迎添加关注！文章转载请注明出处。

特种电源发展走向浅析

电力输配等终端用能环节为重点，研发和推广高效电能转换及能效提升技术。该政策有助于特种电源产业加大研发投入，提升生产技术，提升产品质量。近30年来，我国特种电源技术研究取得长足进步，产品研制能力也得到

发表于 11-05 18:03

直径测量工具的发展历程

关键字：直径测量，工业直径测量设备，线性尺量器，光电测径仪，直径测量工具的发展历程是一个悠久且不断创新的过程，它随着科学技术的进步而不断演变。以下是直径测量工具发展

发表于 10-10 16:55

工控机厂家发展现状及未来趋势

中发挥着重要作用。本文将探讨工控机厂家的发展现状、市场需求、技术创新以及未来趋势。一、工控机厂家发展现状工控机厂家是指专门从事工业控制计算机设计、研发、生产和销售的企业。在中国

发表于 09-29 11:01 •464次阅读

智能制造行业现状与发展趋势

智能制造行业作为现代制造业的重要组成部分，正经历着快速的发展与变革。以下是对智能制造行业现状与发展趋势的详细分析：

发表于 09-15 14:26 •1086次阅读

开启全新AI时代智能嵌入式系统快速发展——“第六届国产嵌入式操作系统技术与产业发展论坛”圆满结束

航空计算技术研究所研究员崔西宁做了“AI时代的机载嵌入式操作系统”专题报告。崔西宁回顾了机载软件技术发展历程，介绍机载智能计算的演进之路，分享了天脉操作系统

发表于 08-30 17:24

影像仪AI运用 #AI #影像测量 #中图影像仪 #自动控制技术

AI影像

中图仪器

发布于 :2024年07月01日 16:20:07

中图仪器AI影像测量技术与智能化生产线的融合

AI影像测量技术与与智能化生产线的融合，是提升生产效率和产品质量的关键因素。AI影像测量技术利用

发表于 07-01 15:20 •819次阅读

中图仪器AI<b class='flag-5'>影像</b>测量<b class='flag-5'>技术</b>与<b class='flag-5'>智能化生产</b>线的融合

传音控股深耕影像赛道，打造支撑多区域市场的核心影像技术能力

随着影像广泛融入新兴市场消费者的日常生活，成为其记录生活、线上社交以及专业影像创作的重要载体，消费者对智能手机影像技术提出了更高的期待和诉求

发表于 05-21 11:11 •471次阅读

STM32国内外发展现状

电子发烧友网站提供《STM32国内外发展现状.docx》资料免费下载

发表于 04-08 15:56 •28次下载

第二集知语云智能科技无人机反制技术与应用--无人机的发展历程

了一系列问题，其中最为突出的便是无人机安全问题。知语云智能科技作为一家专注于无人机反制技术的企业，致力于解决这一难题，为无人机行业的健康发展贡献力量。无人机的发展

发表于 03-12 10:56

万兆电口模块的产业发展现状与前景展望

本文将探讨万兆电口模块的产业发展现状及未来前景。市场需求增长迅速，企业、数据中心、园区网等需求不断推动产业快速发展。产业链布局完整，技术创新推动产业发展。未来市场将继续扩大，产业链上下

发表于 02-21 16:13 •426次阅读

无人机高光谱影像是否真的可以提升农业生产效率？

农业是全球经济中的重要组成部分，而提高农业生产效率一直是农业领域的重要挑战之一。随着科技的不断发展，无人机高光谱影像技术逐渐引起了广泛关注。这项技术

发表于 01-30 11:53 •440次阅读

工程振弦采集仪监测技术的发展现状与展望

工程振弦采集仪监测技术的发展现状与展望工程振弦采集仪监测技术是指利用振弦采集仪对工程结构进行振动检测和监测的技术。随着工程结构的复杂化和要求的提高，工程振弦采集仪监测

发表于 01-22 14:44 •305次阅读

区块链技术发展现状和趋势

近年来，区块链技术作为一项颠覆性的创新技术，引起了全球各行各业的广泛关注。区块链技术的出现，为金融、供应链、物联网等各个领域带来了很多变革的机会。本文将从区块链技术的起源、

发表于 01-11 10:31 •2192次阅读

工业机器人的发展现状和趋势

工业机器人的发展现状和趋势。一、工业机器人的发展现状 1.1 工业机器人的概念及历史工业机器人指的是一种可以自动完成各种工业生产任务的机器人。最早的工业机器人广泛应用于汽车、电子、金属加工等行业。随着

发表于 12-07 17:27 •5747次阅读

搜索历史

智能影像技术的发展历程,智能影像生产技术的发展现状

评论