0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让小机器具备视觉和听觉功能,面临哪些挑战?

jf_pJlTbmA9 来源:jf_pJlTbmA9 作者:jf_pJlTbmA9 2023-07-13 15:46 次阅读

飞行汽车、机器人管家……在一些未来畅想中,今天的人们已经拥有了各式“智慧”产品。如果运气不好的话,高智能机器人大行其道,开始起来反抗人类,再现《机械公敌》剧情。虽然这些想象并未成真,但在当下,人工智能(AI)技术已经走进了人们的世界。比如,每当给Alexa智能音箱指令时,机器学习技术都会努力弄清话语内容,并试图做出最佳判断。每次Netflix或亚马逊推荐了“下一部电影”或“下一次购货商品”时,均是基于复杂机器学习算法而定向推荐,让这些推荐远比之前的促销看上去诱人。尽管自动驾驶汽车尚未普及,但人们纷纷意识到自主导航的潜力和趋势。

人工智能技术大有前途——它让机器可以根据周围的世界做出决策,像人一样处理信息,甚至处理方式还会优于人类。但是,如果细想上述事例,便会发现目前的很多人工智能,只能通过“大型机器”来实现——这些机器发热量高、拥有线路功耗、体积巨大,而且昂贵。像Alexa和Netflix依靠云端的大型、高耗电服务器来分析用户的意图。而自动驾驶汽车则要依赖电池供电,考虑到电池必须能够驱动车轮和转向,因此需要提供很高的容量,与非常昂贵的人工智能决策相比,同样也要消耗大量能源。

目前,人工智能技术稳步发展,但是人工智能的“小型化,边缘化”却明显滞后。那些由小型电池供电或存在成本和尺寸限制的设备无法实现机器的视觉和听觉分析功能。目前,这些小型机器只能利用简单的人工智能技术:也许只是听一个关键词,或者分析低维信号,比如用光容积描记术(PPG)来测量心率。

如果小型机器有视觉和听觉功能会怎么样?

事实上,小型设备一旦能够看到和听到,是否有实用价值呢?思考一下,像门铃摄像头这样的小产品需要使用自动驾驶或自然语言处理等高阶人工智能技术吗?似乎也没有必要。因此可以考虑采用不太复杂、处理强度不大的小型化的、边缘的人工智能计算,比如词汇识别、语音识别和图像分析。

普通的门铃摄像头和消费类安保摄像头经常会被一些无关紧要的事件触发,比如刮风引起的植物摆动、云彩引起的剧烈光线变化、甚至是狗或猫在摄像头前跑动。这些事件可能会导致误触发,从而需要房主去操作忽视并清除此类触发事件。尤其糟糕的是,如果房主正好在世界其它地方旅行,而家里的摄像头却对日出、云彩、日落造成的光线变化发出了误警报会影响他们睡眠和旅行。但一个智能摄像头却能够基于更具体的事件进行触发,例如在所监控的画面中出现了一个人。

门锁或其它出入口可使用面部识别,甚至是语音识别来授予人员访问权限,在某些情况下不需要钥匙或胸卡。

很多摄像头都希望在发生某些特定事件时才触发:例如,跟踪摄像头可能希望在画面中出现鹿时被触发,安保摄像头可能希望在画面中有人或出现开门或脚步声等噪音时被触发,而个人摄像头可能希望通过语音命令来触发。

虽然有很多“Hey Alexa”这样的简单解决方案,但多词汇量命令在很多应用中都非常有用。如果具备识别20个或更多单词的词汇表,就可以在工业设备、家居自动化、烹饪设备和大量其它设备中应用,以简化人机交互。

尽管这些例子只触及表层:让小型机器看到、听到和解决过去需要人为干预的问题,但实际上这是一种颠覆性思路,因为人们每天都不断发现可智能化创造的新场景。

让小机器具备视觉和听觉功能,面临哪些挑战?

既然人工智能对小型机器具有如此实用价值,为何没有被大量开发呢?答案是受限于算力。人工智能推理是神经网络模型计算的结果。可以把神经网络模型看作是大脑处理图像或声音的粗略近似形态,将其分解为非常小的片段,然后在这些小碎片组合在一起时识别出模型。现代化视觉问题的主要模型是卷积神经网络(CNN)。这类模型在图像分析方面非常出色,在音频分析方面也非常有用。问题在于,这些模型需要数百万或数十亿次的数学计算。对于传统硬件设计,这些应用在实施时却会面临一些困难抉择:

使用低成本、低功耗的微控制器解决方案。虽然平均功耗可能很低,但卷积神经网络可能需要几秒钟时间来计算,这意味着人工智能推理不是实时的,并会消耗大量的电池电量。

购置一个昂贵的高性能处理器,能在规定延迟内完成这些数学运算。不过,这些处理器通常很大,需要很多外部组件,包括散热器或类似的冷却组件。好处是,它们执行人工智能推理的速度非常快。

低功耗微控制器解决方案的速度太慢,无法发挥作用,而高性能处理器方法会超出成本、尺寸和电源预算,可以说上述两种方案都不够理想,难以实施。

由此可见,人们需要的是一种全新的嵌入式人工智能解决方案,尽可能减少卷积神经网络计算所需的能耗。人工智能推理需要以比传统微控制器或处理器解决方案更少的能量来执行,并且无需借助能耗高、尺寸大、成本大的外部组件(如存储器)。如果人工智能推理解决方案实际上能够消除机器视觉的能量损失,那么即便是最小的设备也能看到并识别周围世界发生的事情。

幸运的是,人们现在已经处于这场“小型机器”革命的开端。目前,ADI已经在市场上推出了相关产品,能够消除人工智能推理的能源成本,并实现电池供电的机器视觉功能。了解更多有关构建能够执行人工智能推理但能耗却只有微焦耳的微控制器的信息。

责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46838

    浏览量

    237489
  • 机器学习
    +关注

    关注

    66

    文章

    8375

    浏览量

    132397
  • 边缘计算
    +关注

    关注

    22

    文章

    3063

    浏览量

    48603
收藏 人收藏

    评论

    相关推荐

    机器视觉面临挑战及其解决方法

    机器视觉是指使用计算机和图像处理技术从图像中提取信息,并将其转换为机器可理解的格式。这种方法已经被广泛应用于自动化生产、质量控制、测量和检测等领域。然而,机器
    的头像 发表于 11-11 01:03 122次阅读

    《DNK210使用指南 -CanMV版 V1.0》第二章 Kendryte K210简介

    包含的用于加速计算卷积人工神经网络的KPU和用于处理麦克风阵列输入的APU是其机器视觉机器听觉这两大核心功能的基础。同时KendryteK
    发表于 08-30 17:34

    什么是机器视觉opencv?它有哪些优势?

    机器视觉(Machine Vision)是一种利用计算机和图像处理技术来模拟人类视觉系统的功能,实现对图像的识别、分析和理解的技术。OpenCV(Open Source Compute
    的头像 发表于 07-16 10:33 670次阅读

    机器视觉和计算机视觉有什么区别

    机器视觉的研究目标是机器具有类似人类的视觉能力,能够自动、准确地完成各种视觉任务。 计算机
    的头像 发表于 07-16 10:23 459次阅读

    机器视觉的应用实例解析

    ,随着计算机技术、图像处理技术和人工智能技术的不断进步,机器视觉技术得到了迅速的发展和广泛的应用。机器视觉技术的核心是图像处理和分析,通过模拟人类
    的头像 发表于 07-16 10:19 385次阅读

    机器视觉的应用流程是如何实现的

    设计,明确应用目标、功能需求和性能指标。系统设计包括以下几个方面: 1.1 应用场景分析:分析机器视觉系统需要解决的问题,确定应用场景和环境条件。 1.2 功能需求分析:根据应用场景,
    的头像 发表于 07-04 10:47 374次阅读

    机器视觉控制轴运动原理是什么

    机器视觉控制轴运动原理是一个复杂而深入的主题。下面将从以下几个方面进行介绍: 机器视觉概述 机器视觉
    的头像 发表于 07-04 10:42 486次阅读

    机器视觉控制器哪种好

    机器视觉控制器对于提高生产效率、降低成本和保证产品质量具有重要意义。 机器视觉控制器的分类 根据硬件架构和功能特点,
    的头像 发表于 07-04 10:35 472次阅读

    机器视觉的典型结构和基本功能

    对图像进行采集、处理和分析,从而实现对目标进行识别、检测、测量和控制的功能。本文将详细介绍机器视觉的定义、典型结构以及基本功能,并结合相关数据和信息进行阐述。
    的头像 发表于 06-17 10:36 477次阅读

    机器视觉行业就率将迎来一轮“洗牌赛”

    尽管当前机器视觉领域的相关企业普遍面临挑战,但长远来看,随着技术的进步和市场需求的增长,机器视觉
    发表于 03-26 11:10 774次阅读

    解锁机器视觉工业检测难题

    机器视觉工业检测技术在不断发展的过程中,面临一些挑战和难题,在复杂的工业环境中,如光线变化、振动、灰尘等干扰因素会影响图像质量和系统稳定性,导致检测准确性下降。 工业生产中需要处理大量
    的头像 发表于 03-14 17:33 384次阅读

    分析 丨AI算法愈加复杂,但是机器视觉的开发门槛在降低

    准确判断。此外,AI大模型近两年受到关注,也可能被引入机器视觉领域,在跨模态理解和推理等方面展现出更强能力。 AI算法的复杂程度越来越高,机器视觉系统设计
    的头像 发表于 02-19 16:49 622次阅读
    分析 丨AI算法愈加复杂,但是<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>的开发门槛在降低

    机器视觉软件有哪些 机器视觉软件的优点

    机器视觉软件是一种利用计算机视觉技术来模拟和弥补人眼视觉功能的软件系统。它可以通过对图像和视频进行分析,识别和理解目标物体,以实现自动化和智
    的头像 发表于 02-02 10:53 1455次阅读

    机器视觉的四大核心功能

    机器视觉的四大核心功能  机器视觉是一种通过电子系统和计算机软件实现人类视觉
    的头像 发表于 12-25 11:15 929次阅读

    人形机器人能做什么 人形机器人产业化面临挑战

    人形机器人在构型方面接近于人类的躯体,包括手臂、双足、躯干和脖子。除此之外,还要具备一些视觉类的感知能力,以及用于控制运动的算力能力。
    发表于 11-27 11:18 556次阅读