11月份的万物互联专栏讨论了为可随时随地在线操作这样一个时代重新思考相机的必要性。我们也有必要重新考虑这些相机“看”的方式。
如今,计算机视觉可以像大多数人所能做的那样准确地跟踪汽车、人脸和生产过程。当需要筛选大量数据时,计算机视觉模型比人做得更好。
但也存在局限性。要认出一个人或一个动作,计算机仍比人需要更多的时间。它们无法跟随多个摄像机之间的人或物体。它们很容易被骗。它们无法为它们所看到的内容赋予含义。工程师们必须克服这些限制,才能使相机在制造业和智慧城市中更有用。
今天的相机通常可以执行推断(使用算法来将输入的图像与一个预定义的模型进行匹配)。速度为每秒30帧左右,具体取决于这些计算机视觉算法的复杂性。
所有的推断算法基本上都要在成本、速度、内存和准确性这几个变量之间进行权衡。可以快速推断出某个东西是什么的相机可能就要以牺牲准确性为代价,或者可能需要更多内存而导致更高的设备成本。
每秒30帧的速度对于在音乐会人群中找到一张面孔来说是可以的。不过,Xnor.ai公司的运营总监Sophie Lebrecht表示,当涉及到更复杂的计算机视觉任务(如确定制造过程中的错误)时,计算机需要提高处理能力,否则就可能需要使生产线减速。Xnor.ai是一家研发软件来提高计算机视觉能力的公司,其目标是以每秒60帧的速度进行图像跟踪。
加快计算机处理图像的帧速率只是第一步。接下来是构建可以跟踪网络中的多个摄像机之间的对象的软件。例如,在一个监控摄像机上找到一个人,将能让网络在这个人走在其他摄像机前面时自动实时地跟踪他。
为此,我们需要针对复杂模型的快速图像处理能力,以及在相机网络上运行并可以挑出图像的软件。我们的目标是找到一种可以在单个网络上执行此操作而无需将数据发送到云中的方法。这将需要一种算法来识别人,并需要另一种算法来在物理空间中跟踪那个人。它可能还需要叠加在相机上或新的通信协议上的某种软件。
相机还需要避免“对抗性攻击”,这是一个全新的研究领域。就像人可能被视错觉所迷惑一样,计算机的视觉也可能被各种会使正常的图像失真的技巧所欺骗,导致程序识别出图像上并不存在的东西。
也许最困难的任务是创造出能让计算机将含义赋予它们所看到的内容的软件。识别出一个人正在爬行是一回事;相机推断出在地板上爬行的那个人需要帮助或试图避过探测是另外一回事。
到那时,相机及其软件将需要决定下一步该做什么。我们还有很长一段路要走,但是Alphabet公司的研究人员已经在试图教会计算机视觉算法找出含义方面做了令人印象深刻的工作。在将来的某一天,计算机可能会比我们对图像的内容理解得更好,并且会利用它们所看到的来做对我们有益的事情。
-
物联网
+关注
关注
2905文章
44363浏览量
371859 -
计算机视觉
+关注
关注
8文章
1696浏览量
45936
原文标题:物联网相机需要既快又聪明,且能够理解图像含义
文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论