人工智慧开启了新一代机器人技术 Robotics 2.0,最大改变是从原先人工编写程式而来的自动化,迈向了真正的自主学习。本文将尝试揭开人工智慧(AI)应用的神秘面纱,协助读者瞭解 AI 机器人将如何影响我们的未来,并釐清我们常常听到,但却着墨不多、甚至根本尚未全然理解的主题。
本文为「Robotics 2.0」系列文章的第一篇,讲述机器人技术与 AI 对于各大产业和未来工作的影响。我们将讨论 AI 将如何释放机器人技术的潜力,这项新技术的挑战和机会,以及这一切将如何影响我们的生产力、就业状况、甚至日常生活。在人工智慧被大肆宣传的当下,我们希望透过这些文章鼓励更有建设性和全面性的探讨。
重新定义机器人:揭开次世代 AI 机器人 Robotics 2.0 的神秘面纱
提到机器人,我们总有各式各样天马行空的想像:从 Softbank(软银集团)的社交机器人 Pepper、能轻松后空翻的 Boston Dynamics 公司机器人 Atlas、《魔鬼终结者》(Terminator)系列电影的人造人杀手,到电视影集《西方极乐园》(West World)中随处可见、栩栩如生的拟真机器人角色。
我们常常听到两极化的观点;有些人倾向高估机器人模仿人类的能力,认为机器终将取代人类,有些人则对新研究和技术的潜力太过悲观。
在过去一年之中,许多创业、科技、新创业界的朋友都曾问过我,在 AI,尤其是深度强化学习和机器人技术的领域,究竟有哪些「实际」进展?
令人最为好奇的是:
AI 机器人和传统机器人有什么不一样?AI 机器人是否真有颠覆各大产业的潜力?它的能力和限制又是什么?
看来,想要瞭解现在的技术进步和产业格局,是出乎意料的困难,更不用说要对未来做出预测。藉由这篇文章,我尝试揭开人工智慧应用于机器的神秘面纱,釐清这个我们常常听到,但却着墨不多、或根本未全然理解的主题。
首先必须回答的基本问题:什么是 AI 机器人(AI-enabled Robotics)?它们又有什么独特之处?
机器人演进:从自动化到自主化
「机器学习解决了以往『对电脑困难,对人来说却容易』的各种问题,或以更容易理解的方式来说,就是解决了『人类很难让电脑也理解』的问题。」
— — Benedict Evans,安霍创投(a16z)
AI 所造就的机器人技术领域,最大成果是从原先的「自动化」(工程师藉由程式设计编写规则,让机器人遵守)迈向了真正的「自主学习」。
如果机器人只需要处理一件事情,那么,它到底有没有人工智慧,差别其实看不出来;但是,如果机器人需要处理各式各样的任务、或是回应人类与环境的变化,就需要一定程度的自主性才能胜任。
我们不妨借用下列不同等级的自驾车定义,一併解释机器人的演变:
Level 0 — 无自动化:由人类操作机器,没有机器人的参与。(机器人的普遍定义,是指有能力自行从事复杂动作的可程式化拟人机械)。
Level 1 — 单一自动化运作:单一功能已自动化,但不使用环境资讯。这是自动化与制造业中传统的机器人使用现况。透过程式编辑,机器人能够以高精度与速度重复执行特定工作;但直至目前为止,多数实际运用的机器人都无法感知或应变环境的变化。
Level 2 — 部分自动化:透过环境感知所输入的特定功能,协助机器进行决策。例如某些机器人透过视觉感应器,识别并应付不同的对象:然而,传统的电脑视觉,需要对每个对象进行预先登记和清楚的指示,且机器人还是缺乏处理变更、意外状况、或是新对象的能力。
Level 3 — 条件式自主:机器控制了所有的环境监控行为,但仍需要人为检查关注与(即时)介入。
Level 4 — 高度自主:在某些情况下、或是定义的区域内完全自主。
Level 5 — 完全自主:在任何状况下均可完全自主,不需人为介入。
我们现在处于哪一种自主等级呢?
现在,工厂里多数机器人都是透过开放式迴路、或是非回馈方式予以控制。这意味着它们的运作与感测器回馈各自独立、彼此互不影响(level 1)。
少数在工厂中的机器人,会根据感测器回馈而调整操作(level 2);此外还有协作型机器人(cobot),他们的操做更加简单安全,因此能与人类共同作业。然而,相较于产业用机器人,这种机器人的精确度和速度却相形失色。另外,虽然协作型机器人的程式化相对简单,但它们仍然不具有自主学习性;每当工作内容或环境有所变动时,就需要由人类手动引导协作机器人进行调整,或是重新编写程式,机器本身无法自主举一反三,弹性应变。
深度学习(Deep Learning)和强化学习(Reinforcement Learning)能帮助机器人自主处理各种物件,将人类的介入程度降到最低。
我们已经开始看到一些使用 AI 机器人(level 3/4)的前导试行专案,例如「仓储拣货」就是一个很好的例子。在货运仓库中,员工需要根据客户需求,将数百万种不同的产品放入箱子里。传统的电脑视觉没办法处理如此广泛的物品类别,因为每个物品都需要事先登录、并针对机器人需要採取的动作,先进行程式设计。
然而,现在由于深度学习和强化学习技术,机器人能够开始自主学习处理各种物件,降低人类的介入程度。在机器人的学习过程中,可能会出现它未曾遇过的某些货品,而需要人类的协助或示范(level 3)。但是,随着机器人搜集更多的资料、从试验和错误中学习(level 4),演算法也将日益改善,迈向完全自主。
就像自驾汽车产业一样,机器人新创公司也採取了不同的策略:有些公司看好人类和机器人之间的合作,专注于 level 3 的研发;有些公司则相信,机器终将实现真正的完全自主,于是他们跳过 level 3,直接着眼于 level 4、甚至到 level 5。
这也是为什么我们很难评估现在产业自主程度的原因之一。
新创公司有可能自称致力于研究 level 3/4 的自主系统,但实际上却是大量委外,以人工远端操控机器。在无法了解其内部软体及 AI 产品发展程度的前提下,光从机器外观看不出远端操控和自主学习的差别。另一方面,目标为 level 4/5 的新创公司,万一无法在短时间取得理想结果,可能反而降低了客户的早期採用意愿、并导致早期阶段的资料搜集更加困难。
在本文的后半部分,我将进一步讨论新创公司的不同的商业策略思考。
AI 机器人的崛起:运用范围不再侷限于仓储管理
有趣的是,机器人的人工智慧应用潜能甚至高于无人车,因为机器人有各式各样的应用与产业,因此从某种意义上说,机器人理当比汽车更容易实现 level 4 目标。
AI 机器手臂开始在仓库中被採用,就是最好的例子。因为仓库属于「半受控」的环境,不确定性相对低。另外,拣货作业虽然关键、但能容许错误。
至于自主居家型或手术机器人,则要等到更遥远的未来才能实现;毕竟相关环境的变数更多,且有些任务具备不可逆性,以及一定程度的危险性。但是,可以预见的是,随着技术精度、准确性、可靠性的与时俱进,我们将看到更多产业採用 AI 机器人。
许多产业还没有使用机械手臂,主要原因在于传统机器人和电脑视觉的限制。
目前世界上只有大约 300 万台机器手臂,其中大多数从事搬运、焊接、装配等任务。到目前为止,除了汽车业和电子业以外,仓储、农业和其他产业,几乎都还没有开始使用机械手臂;主要原因,就在于上述传统机器人和电脑视觉的限制。
在接下来的几十年中,随着深度学习(DL)、强化学习(RL)、以及云端技术释放出的机器人潜力,我们将看到新一代机器人带来的爆炸式增长、并改变产业格局。其中,AI 机器人的成长契机有哪些?新创公司和现有业者,又採取了哪些不同的方法和商业模式,来因应新科技带来的变化?
新世代 AI 机器人新创公司产业概况
接下来,我会介绍不同市场区隔中的几间范例公司。这样的概略介绍,当然无法涵盖所有企业的状况;欢迎你提供其他公司及应用案例,一起让内容更加完备。
AI/Robotics 新创公司市场概况
研究新世代机器人新创产业结构,可以看到两种截然不同的商业模式:垂直应用与水平应用。
1. 垂直应用
第一种是垂直应用:硅谷当地多数的新创公司,专注于为特定的垂直市场开发解决方案;如电子商务物流、制造业、农业等等。
这种提供完整解决方案的作法相当合理,毕竟相关技术还处于萌芽阶段;公司不依赖他人提供关键模组或元件,而是建构端对端的解决方案。这种垂直整合的解决方案能更快进入市场,也能确保公司更全面掌握终端使用者的案例与效能表现。
但是,要找到像「仓库分拣」这样相对容易实现的应用案例,则没有那么容易。仓库拣货是相对简单的工作,客户的投资意愿与技术可行性都较高,而且每个仓库几乎都有相同的拣货需求。
但在其他产业(如制造业)中,装配任务可能因工厂而各不相同;另外,在制造业中执行的任务,也需要更高的精度和速度,技术上相对困难。
目前具有学习能力的机器人,仍无法达到与封闭迴路机器人相同的精度。
尽管机器学习能让机器人与时俱进,但目前透过机器学习运作的机器人,仍无法达到与封闭迴路机器人相同的精度,因为它需要累积尝试错误的经验,从错误中学习,逐渐进步。
这点说明了为什么 Mujin 和 CapSen 机器人这样的新创公司,并未採用深度强化学习,反而选择使用传统电脑视觉。
然而,传统电脑视觉要求每个物件都要事先登录,终究还是缺乏扩充和适应变化的能力。一旦深度强化学习(DRL)达到了效能门槛、逐步成为产业主流,这种传统方法终究会变得无用武之地。
此外,这些新创公司的另一个问题,在于它们的价值往往遭到高估。我们经常看到,新创公司在硅谷筹集了数千万美元资金,却无法承诺创造出任何真正具体的收入流。
对于创业者来说,「描绘」深度强化学习的美好未来,再容易也不过了;但现实则是,我们还需要数年的时间才能达到如此的成果。尽管这些公司离创造获利还有一段距离,硅谷的创投仍愿意继续押宝在这些人才优秀、技术先进的团队上。
2. 水平应用
另一方面,水平应用则是更实用、却比较罕见的模式。我们可以简单将机器人技术简化为感测(输入)、处理、驱动(输出)三个部分;除此之外,还有开发工具。(这里使用的「处理」一词,同时概略涵盖了控制器、机器学习、作业系统和机器人模组等等,各种不属于感测或驱动的其他项目。)
我认为未来,这个领域将最具增长潜力。对于机器人的用户来说,破碎而零细的市场是棘手的问题;因为所有的机器人制造商,都各自推展自家开发的语言和介面,使得系统整合商与终端使用者,都很难将机器人与相关系统进行整合。
随着产业的逐渐成熟,有越来越多机器人应用到了汽车和电子厂以外的领域;因此我们更加需要标准的作业系统、通讯协定、介面,从而提高效率、并缩短上市时间。
举例来说,美国波士顿的几家新创公司正在研究相关的模组;例如 Veo Robotics 公司开发的安全模组,能让工业机器人更安全地和人类协同工作;Realtime Robotics 公司则提供加速了机械手臂路径的解决方案。
评论
查看更多