自动驾驶领域的技术变革呼之欲出,深度学习进入“视频学习”时代-电子发烧友网

自动驾驶领域的技术变革呼之欲出。

如果说，自动驾驶大规模落地的痛点在于深度学习的范畴仅限于图像等静态材料，那很快，自动驾驶深度学习的范围将扩展到视频领域。

近日，众安信息技术服务有限公司(以下简称“众安科技”)数据科学实验室的论文"Dense Dilated Network for Few Shot Ac tion Recognition"(《基于密集扩展网络的少样本视频动作识别》)被ICMR(国际多媒体图像分析峰会)录用，这是深度学习在视频分类领域的创新应用，在驾驶行为分析、视频检索等领域有重要的业务价值。

深度学习进入“视频学习”时代

“读图”已经无法满足机器的学习胃口。深度学习是机器学习中一种基于对数据进行表面特征的方法，其概念源于人工神经网络的研究。目前，深度学习的主要素材来源于文字、图片，而随着智能手机等设备的发展，视频沉淀了大量深度学习素材。近年来人工智能、神经网络的发展更是促进了视频的分类、识别的研究。

不过，机器想要学习视频素材绝非易事。一般来说，训练深度神经网络需要大量标记良好的数据。对于机器来说，由于视频动作、视角较多，且视频每秒都包含了20-30帧画面，数据规模较大，机器的标注难度比标注图像复杂很多倍。另一方面，就视频本身而言，虽然不同的视频内容差异很大，但同一类的视频在语义上有着很高的相似性，对于机器学习来说，如何避免“重复劳动”也是摆在现实面前的一道难题。

针对上述难题，众安科技通过在视频多样性中提取高层共有的特性来实现机器学习。

众安科技方面表示，基于机器学习视频的痛点，数据科学实验室研发了一种新颖的神经网络架构来同时捕获局部信息和整体时空信息。具体来看，众安科技采用了扩张卷积网络，在这个网络的不同层之间，使用密集连接的方式组合，由此可以融合每一层的输出，从而学习视频的高级特征。

和其他网络架构相比，众安科技的这款神经网络架构利用每层与之前所有层相连的方式，可以得到从最初局部特征到总体视频的所有特征信息。而每层网络使用了扩张卷积(dilated convolution)，相比原始的卷积方式，可以更加充分利用时空信息。因此不需要很深的层数，在少量数据下就可以训练效果较好的网络。

以目前动作类别数、样本数较多的数据库之一UCF101为例，众安科技在此数据库的通用视频数据集上进行了大量实验，在仅有20%的训练数据时(模拟对新任务的快速学习)，利用该神经网络架构，机器仍然可以学到每类视频的高层语义特征。

视频深度学习下个落地场景：出行、医疗

视频深度学习有望率先在出行和医疗领域落地。

众安科技研发的这款神经网络架构在实战中也有很高的应用价值，由于该架构只需要少量训练数据就可以促进不同任务之间的迁移学习，帮助系统快速上线，从而减少了大量采集数据和训练过程。

如在车险领域，可以使用该方法对路口监控或行车记录仪等视频进行快速分析，识别碰撞和高危驾驶片段，从而对车主的驾驶行为进行建模，实现车险的自主定价。

此外，在医疗方面，目前人工智能辅助医疗的手段除了CT图片等，还有许多造影等多样的数据有待分析。该方法利用时序信息，可以针对造影进行识别诊断，尤其是对于病例较少的罕见病分析更为高效。

众安科技数据科学实验室认为，该神经网络架构针对出行和医疗领域会有较大的帮助，这也是该团队未来产学研结合的落地方向之一。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4762

浏览量
100527
机器学习

机器学习

+关注

关注
66

文章
8375

浏览量
132398
自动驾驶

自动驾驶

+关注

关注
783

文章
13680

浏览量
166115

原文标题：从图像识别走向视频识别，众安科技推出视频深度学习利器

文章出处：【微信号：robot-1hjqr，微信公众号：1号机器人网】欢迎添加关注！文章转载请注明出处。

GPU深度学习应用案例

能力，可以显著提高图像识别模型的训练速度和准确性。例如，在人脸识别、自动驾驶等领域，GPU被广泛应用于加速深度学习模型的训练和推理过程。二、自然语言处理自然语言处理（NLP）是

发表于 10-27 11:13 •326次阅读

激光雷达技术的基于深度学习的进步

信息。这使得激光雷达在自动驾驶、无人机、机器人等领域具有广泛的应用前景。二、深度学习技术的发展深度

发表于 10-27 10:57 •293次阅读

人工智能的应用领域有自动驾驶吗

的核心技术 自动驾驶汽车的核心依赖于人工智能，尤其是机器学习和深度学习技术。这些

发表于 10-22 16:18 •350次阅读

Mobileye端到端自动驾驶解决方案的深度解析

强大的技术优势。 Mobileye的端到端解决方案概述 1.1 什么是端到端自动驾驶？端到端自动驾驶解决方案是一种新型的智能系统架构，旨在通过AI学习从感知到决策再到操作的全流程。M

发表于 10-17 09:35 •292次阅读

NVIDIA推出全新深度学习框架fVDB

在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。

发表于 08-01 14:31 •518次阅读

FPGA在自动驾驶领域有哪些优势?

FPGA（Field-Programmable Gate Array，现场可编程门阵列）在自动驾驶领域具有显著的优势，这些优势使得FPGA成为自动驾驶技术中不可或缺的一部分。以下是FP

发表于 07-29 17:11

FPGA在自动驾驶领域有哪些应用？

控制。在视觉算法方面，FPGA利用自身并行处理和高速存储器的特点，极大地加快了算法的执行速度，提高了运算效率。五、未来发展趋势随着自动驾驶技术的不断发展，FPGA在自动驾驶领域的应用

发表于 07-29 17:09

深度学习在自动驾驶中的关键技术

随着人工智能技术的飞速发展，自动驾驶技术作为其中的重要分支，正逐渐走向成熟。在自动驾驶系统中，深度学习

发表于 07-01 11:40 •667次阅读

中级自动驾驶架构师应该学习哪些知识

随着自动驾驶技术的成熟，对系统架构师的需求逐渐增加。自动驾驶系统架构师负责设计整个系统的结构、组件、接口和数据流；需要协调不同领域的专业知识，确保系统的可靠性、安全性和性能。总之，

发表于 06-20 21:47 •256次阅读

初级自动驾驶架构师应该学习哪些知识

随着自动驾驶技术的成熟，对系统架构师的需求逐渐增加。自动驾驶系统架构师负责设计整个系统的结构、组件、接口和数据流；需要协调不同领域的专业知识，确保系统的可靠性、安全性和性能。总之，

发表于 06-20 21:45 •261次阅读

智能驾驶大模型：有望显著提升自动驾驶系统的性能和鲁棒性

智能驾驶大模型是近年来人工智能领域和自动驾驶领域最为前沿的研究方向之一，它融合了深度学习、多模态

发表于 05-07 17:20 •1513次阅读

未来已来，多传感器融合感知是自动驾驶破局的关键

/L4级自动驾驶赛跑的元年。马斯克评论FSD 12.3版本的左转弯操作就像人类司机一样。如果FSD 12.3版本成功，将基本颠覆目前市场上的智能驾驶技术路线。基于“数据/算法/算力”的无人驾

发表于 04-11 10:26

为什么深度学习的效果更好？

导读深度学习是机器学习的一个子集，已成为人工智能领域的一项变革性技术，在从计算机视觉、自然语言处

发表于 03-09 08:26 •593次阅读

LabVIEW开发自动驾驶的双目测距系统

LabVIEW开发自动驾驶的双目测距系统随着车辆驾驶技术的不断发展，自动驾驶技术正日益成为现实。从L2级别的辅助

发表于 12-19 18:02

金龙汽车与华为达成自动驾驶领域深度合作

另外，金龙汽车已进入自动驾驶领域，旗下智能车覆盖了从1.6米到1.8米各种尺寸机型，致力于打造最全面的智能网联产品线，满足各类市场以及使用场景的出行需求。同时，其L4级自动驾驶

发表于 12-13 09:43 •1993次阅读

搜索历史

自动驾驶领域的技术变革呼之欲出,深度学习进入“视频学习”时代

评论

GPU深度学习应用案例

激光雷达技术的基于深度学习的进步

人工智能的应用领域有自动驾驶吗

Mobileye端到端自动驾驶解决方案的深度解析

NVIDIA推出全新深度学习框架fVDB

FPGA在自动驾驶领域有哪些优势?

FPGA在自动驾驶领域有哪些应用？

深度学习在自动驾驶中的关键技术

中级自动驾驶架构师应该学习哪些知识

初级自动驾驶架构师应该学习哪些知识

智能驾驶大模型：有望显著提升自动驾驶系统的性能和鲁棒性

未来已来，多传感器融合感知是自动驾驶破局的关键

为什么深度学习的效果更好？

LabVIEW开发自动驾驶的双目测距系统

金龙汽车与华为达成自动驾驶领域深度合作