近些年人工智能企业在中国受到了资本、媒体、社会以及政府的高度关注。前一段时间在香港提交IPO招股说明书的旷视科技也不例外,拿出了冲击中国AI科技第一股的架势,可谓话题感满满;2019上海世界人工智能大会也刚刚落幕,商汤科技、极链科技、第四范式、思必驰等人工智能企业集中展示了一年来的创新成果;斯坦福AI实验室基于计算机视觉技术打造智能医院,帮助医院降低感染率并改善病人的健康。
一组数据显示,2018年中国13项目人工智能技术中计算机视觉应用占比为29%,排名第一。AI投资方面2017年投资频次达到历史峰值425笔,2018年的投资金额达到历史峰值1045亿元。回顾三年内人工智能行业的研发成果,不可否认,计算机视觉是人工智能在中国落地应用最顺利的技术了。相比进程坎坷无人驾驶技术,计算机视觉技术已经大规模的实现了商业化落地。
不少人工智能从业者和技术研发者认为:头部AI企业已经面临技术瓶颈。不管技术研发到何种地步,计算机视觉的场景化应用已经带来了巨大的社会价值和商业价值,比如AI+安防的”疑犯追踪“、AI+零售的”无人售货“、AI+物流的”面单识别“、AI+医疗的“影像诊断”等。在AI赋能安防、医疗、金融领域浪潮过后,“视联网”或将成为下一个蓝海。
5G+AI驱动“视联网”实现
“下载一部高清电影,只需要十几秒”这是业界对5G速度的描述,在5G+AI支持下,视频将成为连接人与下一代智能设备、人与互联网的重要媒介,进而形成以视频作为主要信息传递介质和功能载体的互联网形态——视联网。AI技术在视联网中的核心是对视频的识别,即通过算力、算法、大数据的优化,代替人工筛查。一方面对于网络视频安全,AI技术可以实现,对视频的高频场景进行敏感信息的检索,包括画面、图片、语言、等多维度的信息筛查。另一方面,综合视频平台每年耗费大量资金购买视频播放版权,但是除了热播内容外还有大量视频的变现能力亟待提高,AI技术将优化用户体验以及挖掘视频的商业价值。
视频数据标注
除了提高算法精度以外,提高数据标注的效率也是当前众多计算机视觉公司的重要课题之一。Google、Microsoft等互联公司相继推出了自动标注系统AutoML和Cognitive Services。迁移学习、主动学习等算法的应用也是重要研究方向。
视联网下的“视频数据标注”,可以理解为对视频的精细化分类,不同于用户所看到“惊悚”、“喜剧”、“科幻”分类,“内容标注”主要针对全网视频进行多种维度的标注。极链科技VideoAI技术将视频划分出人、物、空间、事件四大维度,其中人、物可细分为姓名、表情、吃、汽车、品牌、手机等多个标签,而在空间、场景中还包括、聚餐、约会、谈判、旅行、加班等。
内容的精细化标注分类,可直接助力于视联网VideoOS应用市场,让视频应用直接为用户提供搜索、购物、知识、社区、游戏等多种功能服务。简言而之,当你在看韩剧时非常想吃韩式拉面,通过视频应用可以发现周边口碑最好的韩式美食,以及视频电商直接购买相关的速食食品。
服务入口
场景经济,是当今互联网行业的必修课程。淘宝是购物服务的入口,滴滴是出行服务的入口,支付宝是金融服务的入口,视联网就是视频场景下的各种服务的入口。视联网模式要做的就是在用户观看视频的场景下,基于用户需求的平台化服务入口。
软硬件日趋成熟
AR/VR、3D建模等技术正在逐步实现商用化,而AR/VR类似技术应用初期的商业化路径,多数是通过游戏和娱乐形式来实现的。MIT研究团队发布了相关研究报告,目前视频技术已经可以轻易做到在维持原有视频含义的情况下,自动生成新的影片,实现换脸或视频合成等功能。
以智能眼镜为例,当人们带上智能眼镜后,本质上是将摄像头捕捉到的视频信息以虚拟层的形式与人看到的真实世界进行重合,进而可以在两者间展开丰富的互动,但这种互动的要求必然是零转换、低延时的。随着软硬件的开发和协同能力的提高,相关智能设备或将成为视联网成熟阶段用户观看视频的物理介质,同时会有更多视联网应用出现。
视联网发展的核心是视频识别能力的不断积累,视联网的参与主体们都在努力修炼自身算法,以期尽早占据技术高地,形成独一无二的产品优势。
应用场景和数据的增多会有助于进一步优化视频识别算法,从而为应用场景带来更好的服务效果,促进商务的更快拓展。因此,对于以技术为核心的众多初创企业而言,迅速拓展商务能力不仅能带来高速增长的业绩,更是企业生存和竞争必要选择。
从市场规模看,当前已有的广告和电商的互动形式将支持视联网迅速踏上百亿级的台阶,三年的估算是一个相对保守的测算。我们发现两个趋势,一是视频场景广告正在替代传统前贴片广告,而场景广告现有规模已经接近500亿之多;二是视频生产的门槛降低,随之而来视频量迅速增多,视频内容占全网数据存储量的83%。对于视联网企业而言,加强资源整合,形成行业+技术的综合壁垒将是关键。
发布评论请先 登录
相关推荐
评论