随着 “平安城市”、“智慧城市”建设的不断加快,城市安防飞速发展,视频监控设备普及程度日渐提升,视频监控和大数据应用是重中之重。据市场研究机构iHS预测,到2020年,全球每年出货约2.5亿个监控摄像头,所有数字监控系统的摄像头,每天会生成总计1.6EB的数据。
然而,传统上以监控为主的方法,重点放在“看得全”上,并没有充分利用收集到的视频数据,太过被动;海量存储的视频调用困难,不够智能灵活,不足以提供最好的安全性;在视频调用、回放中费时费力,人工参与应对乏力,容易出错。
海康威视是全球视频监控数字化、网络化、高清化的重要推动者,连续六年蝉联iHS全球视频监控市场占有率第一。海康威视研究院算法总监沈林杰举了这样一个例子:“在治安监控里,需要对人、人体、 人脸、机动车等进行高清图片抓取。传统的视频,都是以做监控为主,图像清晰度不足,无法进行智能解析。公安部门的需求,是从图像中获取高清的车辆、人脸,为后面的结构化大数据应用提供支持。”
这就涉及到智能化视频监控接下来要解决的两个核心问题:
★ 如何保证摄像机端优先捕捉有特征信息的高清图像,来缓解后端分析系统的工作压力,并为深度学习提供更多高质量的样本数据?
★ 如何充分利用深度学习和训练的成果,不仅用于数据挖掘和分析上,还要正向反馈给前端摄像机,让它们在捕捉高价值信息时能更高效,更可靠?
有鉴于此,海康威视与英特尔公司密切配合,使用英特尔 Movidius VPU视觉处理单元,采用人工智能和机器学习相关的软硬件技术,开发了“深眸”全局摄像机,推进视频监控智能化,为平安城市保驾护航。
定点+动点: 看得全,更看得清、看得准
“深眸”全球摄像机采用创新的“双镜头”设计,集合定点广角摄像头和动点长焦摄像头。广角摄像头负责视频采集,长焦摄像头负责捕捉视频关键特征信息画面。定点看全景,动点看细节。监控距离远、范围广,可以持续抓拍细节,解决了使用场景单一、抓拍效率低、无法在开放式场景进行特征信息采集的问题,绝对“看得全”。
具备“双镜头”功能的海康威视“深眸”全局摄像机
更重要的是,在英特尔 Movidius VPU视觉处理单元的指挥下,两个镜头可以彼此配合。
在城市监控视频后期调用的过程中,VPU 中内置的智能学习芯片会让摄像机先借助算法做判断,自动检测和识别人员、车辆等特征信息,只要发现有目标进入预定区域,它就会调动定点镜头进行快速检测,并协调动点镜头进行快速锁定和抓拍。从而做到“看得清”,“看得准”。
因此,集成了人工智能的“深眸”,避免了误报和误拍,不会传送大量无效图像到后端,也不再需要大量枯燥无味的人工人眼识别过程,节省了宝贵的网络和计算资源,更让人解放出来,可以做更有价值的事情。
到目前位置,“深眸”已经在各地公安和交通部门进行大量测试,相较传统前端设备的高误报率,“深眸”全局摄像机对人、车等特征信息的识别率达到了90%以上,大幅提升了图像识别准确率。
闭环反馈,智能进化
“深眸”的特别之处还在于,它是一款可以不断进化的摄像头。
在英特尔的协助下,海康威视设计了一套高效的“数据采集—计算识别—算法优化—算法更新”的正反馈创新模式。摄像头采集和传送的数据,经过英特尔Movidius VPU处理、提取信息特征后,会传送到后端的深度学习平台,用于进行样本训练,优化机器学习算法,然后可以远程升级前端的摄像机,使其不断进化,更加智能。
海康威视智能视频监控系统正反馈创新逻辑示意图
同时,为了满足深度学习平台的大量浮点运算能力需求,海康威视准备使用英特尔至强融核 处理器,以及用于并行计算环境I/O 加速的英特尔 Omni-Path 架构(简称 OPA)。单颗至强融核 处理器可以有多达72个内核,以及超过3TFLOPS的性能,并可直接访问大容量内存,非常适合处理海量视频内容。而 OPA 的传输能力可以达到100G bps,以超低延时,提升多机训练时的交互和并行效率。在深度训练的软件上,海康威视和英特尔携手优化相关算法和计算框架,例如基于英特尔提供的MKL-DNN库,以及针对英特尔 架构优化的Caffe框架,以便于向至强融核 处理器平台和 OPA 平滑迁移,加速整个智能监控系统的进化。
人工智能,解放人类
导入英特尔人工智能软硬件、而且不断智能升级的“深眸”,得到了用户认可。“来自于用户的反馈显示,新系统能够很好地提高破案效率,”沈林杰表示:“原来通过人工观察摄像机画面逐个找人的方式,变成通过机器以人找人,以人脸找人脸。新的模式显著提升了工作效率,也大大提高了准确率。”
-
处理器
+关注
关注
68文章
19391浏览量
230633 -
人工智能
+关注
关注
1793文章
47567浏览量
239424 -
智能监控
+关注
关注
5文章
248浏览量
31810
发布评论请先 登录
相关推荐
评论