是什么横亘在我们面前,导致在人工智能高歌猛进的今天,距离自动驾驶的明天,仍相去甚远呢?这其中的重重关卡恐怕只有从业者才能领会。于是,我们从技术层面(车的问题)和心理层面(人的问题)总结了出了以下几个挑战。
某年某月的某一天,“司机”这个称呼会具有完全不同的意义(说的不是老司机啦)。想象一台车成为一场流动的盛宴,宾客交欢,觥筹交错,不觉日已西沉…打住,这样的场景还得个几十年。那么,是什么横亘在我们面前,导致在人工智能高歌猛进的今天,距离自动驾驶的明天,仍相去甚远呢?这其中的重重关卡恐怕只有从业者才能领会。于是,我们从技术层面(车的问题)和心理层面(人的问题)总结了出了以下几个挑战。
车的问题——技术难点
1、对环境的感知
关于谷歌无人驾驶汽车(以下简称 G-car),一个长久以来的误解可能就是:它是全凭自己在行驶过程中实时“看”到的情境来做决定的。但事实上,它走过的每一步都是工程师们用汗水洗刷过的——他们会事先在目标路线上来回数遍,绘制一份尽可能详尽的3-D地图教给 G-car。显然这是个很耗时的工程,那么为什么要这么做呢?
答案是为了省下运算时间和能量,来处理行人、车流和其他各种实地行驶过程中的突发状况。可是,谷歌的3-D地图目前也只覆盖了很有限的几片实验田,如加州景山。待到自动驾驶上路那一天,这样地图不仅要大面积覆盖,而且要随时更新,这工作量不言而喻。
然而计划总是赶不上变化,牛津大学的研究者对英格兰一条长6英里的街道特征进行了为期一年的记录——结论是街景始终在改变,单是一个转向路标就挪动了三次。如果再考虑到天气变化,难度就更大了。
比如在常常大雪封山的日本北海道,为了给司机标示出路面的宽度,随处可见下图这样指向路肩的小箭头。如果你对电影《非常勿扰》还有印象,也许就会想起笑笑姑娘(舒淇)曾经告诉过你它们是做什么用的,可是,如果你的爱车没看明白呢?
对于这个问题,谷歌表示很自信,因为随着越来越多的自动驾驶车上路,会有源源不断的路面信息传回绘图小组。当然,如果各个公司的自动驾驶研发团队能够共享信息的话,这个进程会快很多。
从另一个角度来讲,提前绘图也不是唯一出路,钢铁侠的Tesla就更倾向于依赖对图像和传感器信息的实时处理。不过目前来看特斯拉主要是辅助驾驶,还没有采用G-car那么激进的无人驾驶。长远来讲,哪条路子走的更稳仍未可知。
2、对意图的理解
作为一辆无人驾驶汽车,仅仅看到周围是远远不够的,你还要知道正发生着什么:一个包裹着你轻柔的致富梦想的塑料袋在风中飞舞,需要躲避吗;路旁一位行人一边通话一边四处张望,她确定是要过马路吗;交通警察挥舞的手势透着机械舞的韵律,这到底是什么鬼。这些情况都对计算机视觉提出了非常高的要求。
就像一个坏脾气的学霸在给你讲解习题的时候常常咆哮的那样:为什么这么简单的东西你就是不懂?这其实是在人类理解机器视觉或者笼统的讲——机器学习的时候常常遇到的一个困境,即机器善于处理我们认为的困难问题比如下棋,可更多的时候它像个书呆子一样面对现实生活一筹莫展,尤其是涉及推断另一些人的决策的时候。
正如今年2月14日谷歌汽车的艳遇一样,它天真的以为后面驶来的公交车会让路给它,而这次任性的变道结果就是:
好基友Tesla当然不忍心看着G-car独自挨骂,于是就在上个月,它也急吼吼地撞了。起因是它前面的一辆正在行驶的车为了避让路边停靠的小货车变道了,于是后面耿直的Tesla就径直撞上了小货车,前车的心思看来它没懂啊。
诚然类似的错误人类司机也是难免,并不是要求自动驾驶汽车一面世就得天衣无缝。观众们的普遍要求是:比人类司机好就行。但仅此一点,就说不准。
要知道谷歌汽车自2009年起,已经累积了130多万英里的驾驶经验,而与之相比的是,美国司机平均行驶逾亿英里发生一次致人员死亡的严重交通事故。以目前自动驾驶这幺小的里程样本,还远不足以驱动传统的计量方法来对它统计意义上的安全表现给出可靠的估计,简言之,它还有hin长的路要走。
与此同时,也需要开发新的检测自动驾驶技术安全性能的方法,否则以现在这个速度,实验到天荒地老也不会有结论。
3、对“人—车接口”的控制
自动驾驶这一剂良药多以电动汽车冲服,这一方面得益于电机易于精确控制,另一方面也是二者受众重合度高,便于推广。只要前面两个问题处理得好,且行人没有摆出各种经典的道德困境队形(如trolley dilemma)来刁难它,“开车”这件事情本身并不是很困难。
自动驾驶普及并联网之后会是一片喜人景象。线路优化,汽车共享,智能交通统统不再是梦,更不用说规模效应一旦形成,路标交规行人等,都势必会做出相应的调整以适应,这样一个自动驾驶友好型交通环境,会反过来减轻它感知和理解方面的困难,形成正反馈。
而在这之前,即便是最先进的自动驾驶汽车还是会时不时地身陷超出其智慧所能处理的环境。届时,就靠人类接管了。于是引出了自动驾驶或者更广泛的意义上来讲——辅助驾驶都面对的一个问题:交接。
它该如何把备胎驾驶员从睡梦中摇醒(下图,Tesla司机在自动巡航时睡着了),从电影拉回现实,或者中断他的通话成功引起他的注意?要知道一个聚精会神沉浸在公路追逐片里,盯着连环撞车镜头的人,错过任何语音灯光提示都不稀奇。
最终人们发现还是笨办法靠谱——震动——只要0.8秒钟就可以让一个正专注于回邮件的乘客切换到“司机”模式。那么与此同时,车辆该怎么告诉他危机所在的方位呢?
之前有研究显示“身着有触感的腰带,人对其水平方向上震动的感知可以精确到10度”,所以可以根据需要人类查看的空间方位来刺激相应的人体部位。不过,即使震动警告可以有效做到这一点,让它跟繁杂的其它信号如灯光、蜂鸣、语音等同时作用,可能反倒让人无所适从:大脑被“警报洪水”过载了,蒙圈儿了……
为了避免上述情况。合理的建议是不同的警告模式用于人类接管过程中的不同阶段。比如用震动来唤起人们的注意力,再用可视化的方法告知危险方位,这样一来就同时利用了二者的优点:既触觉使人迅速反应,视觉精确告知待处理的情况。
不过笔者认为,试想你在车里,吃着火锅唱着歌,突然爱车虎躯一震你心头一紧,这时候,不论它是要你处理无关紧要的麻烦,还是交给你生死攸关的抉择,这都不是什么好的体验,也不是自动驾驶的初衷。
不过,乐观来讲,技术问题一直在进步,只要其增速不减,那么达到某一个固定目标只是时间问题。而另一个难题在于,如何让人们接纳这个新鲜事物呢?
4、人的困惑——信任危机
如果说解决车的问题要晓之以理,那么面对人类阵营就只能动之以情了。首先要面对的就是,我们准备好了吗?技术巨擘和机动车厂商在自动驾驶上砸了数十亿美元,他们迫切希望公众信任这样的汽车。
可是,据密西根大学交通研究院的一项调查显示,对自动驾驶汽车的信任问题仍是司机的一块心病:四分之三的美国司机对乘坐自动驾驶汽车表示恐惧或者担忧。
当被问及是否愿意购买或者租用自动驾驶汽车时,他们的回答也不容乐观。超过三分之一的人表示:门都没有。
究其原因,安全问题还是人们最关心的。好消息是,这种疑虑会被逐渐打消。大众汽车此前做过一个名为“绿野仙踪(Wizard of Oz)”的研究,让志愿者乘坐由人类司机驾驶的汽车,但同时使他们误以为这是一台机器操控的自动驾驶汽车。尽管一开始都惴惴不安,十来分钟后乘客们都基本能够放下焦虑享受舒适的旅程了。
类似的关于信任的研究,佛吉尼亚理工交通研究所也有一份,他们招募了几十位志愿者,实验要求被测人员保持警惕,观察路面和周遭情况以便必要时控制汽车。但绝大多数司机都表示自己很快就放松下来了,手脚也都脱离了控制位置。(呵呵,参见前面那位睡着的同学。这么容易就放松警惕到底是好是坏呢?)
人类对自动驾驶的不信任,一类源自于对技术本身的怀疑态度。而另一层更深入的恐惧则直指掌握技术的那些人的道德准则。
在车载雷达的眼里,路上每一位行人都是一个漂浮的“生存几率”,或者说“抗撞击指数”,情非得已的时候,它也只好动用这些数字来擅自决定“牺牲”其中的哪一个甚至一些。那么,假设我们是自动驾驶汽车里的乘客,会期待自己的座驾按照什么道德准则来行事呢?是下面的左边还是右边呢?
我们希望路上所有的车都具有高尚的情操在必要的时候可以舍己为人,除了我自己乘坐的那一辆之外。(nani?)事实上,大部分人都表示不愿购买被预写入了“舍小家为大家”程序的车辆,你呢?
一面是日新月异的技术,一面是心思诡谲的众人,夹在这其中的立法程序走得那叫一个跌跌撞撞。不过,那就是另外一个故事了,以后有机会笔者在跟大家聊聊美国针对自动驾驶汽车的立法进程。
结束语
话说回来,工业化进程一步一个脚印,这些雷区哪一个没踩到过。我们学到的就是:总会有方法解决,如果机器的智能遇到了瓶颈,实在不行还有人类自己的思维可以改造。
先让层出不穷的辅助驾驶技术在培养群众基础的同时广泛积累经验,再在小范围内试点全自动驾驶特区以点带面,待时机成熟结成统一战线争取全面胜利。
一则有意思的小故事,说是每到911纪念日,世贸中心遗址就会竖起两道光柱,上达几千米,百余公里外清晰可辨,而对于迁徙路过的鸟群来讲,它们的生物导航系统会误以为这是自然光源,从而盘旋其周无法逃离,后来在鸟类学家建议下,光柱每隔一段时间会关闭20分钟,放飞它们。
我们跟机器的相处也是一段学习:机器学习开车,而人类,学习与机器同行,要有两只伸出的手,才可以友好地握在一起。
-
自动驾驶
+关注
关注
783文章
13680浏览量
166117 -
无人驾驶汽车
+关注
关注
17文章
150浏览量
37334
发布评论请先 登录
相关推荐
评论