与其他驾驶公司不同,特斯拉售出的所有车都是数据收割机,能够形成大体量的数据集。特斯拉采用模仿学习的机器学习技术,且认为在提供足够多的数据的情况下自己能够成功训练出表现出色的自动驾驶技术。特斯拉正在通过一系列工作搭建自身的训练流程,它在自动驾驶上的发展手段有可能会在某时间点实现瞬间的技术突破从而给汽车行业的发展带来颠覆性影响。
2018 年 11 月,国外科技媒体 The Information 曝料,称特斯拉使用的是名为「模仿学习」(imitation learning)的机器学习技术:
「与其他自动驾驶公司不同,特斯拉售出的所有车都是数据收割机,即使 Autopilot 处于关闭状态,车辆传感器也能照常工作。
因此,Autopilot 团队手中有用不完的数据,他们能从中发现人类驾驶员在不同场景下的驾驶方式,并对其进行模仿。
在取其精华,去其糟粕后,这部分信息就成了车辆在特定场景下行驶的辅助附加因素,它们能教会车辆如何转弯或躲避障碍物。」
The Information 在文中转述了那些模仿学习「信徒」的理念:特斯拉工程师相信,只要给神经网络灌入足够多的驾驶数据,就能让 Autopilot 学会大多数情况下的转向、刹车和加速操控。
他们甚至认为,未来连代码都不用写了,在特定场景下,自动驾驶系统就知道该怎么做。
这些工程师并不是盲目乐观,因为他们提出这些观点几个月后,谷歌旗下的 DeepMind 就用模仿学习让 AI 成了《星际争霸》顶级高手。
而在此前,这款游戏是 AI「修仙」路上的一座高峰。
就连 Google Brain(谷歌 X 实验室重要项目)机器学习工程师 Alex Irpan 都为此感到吃惊:
「我们一直觉得这种长期任务是模仿学习的死穴,此前我甚至认为它根本玩不转《星际争霸》,谁知道结果如此出人意料。我们的担忧在于,如果 AI 犯了错,它会发现自己处于没有人类习惯可模仿的尴尬境地。」
Irpan 推测认为,只要数据量够了,DeepMind 的 AI 就能成功跨过这个坎:
「如果你的数据集非常大,囊括了不同级别的技巧,比如将所有玩过《星际争霸》的玩家操作都记录在内,那么你的数据就足够让 AI 学会如何在作出错误判断后成功翻盘了。」
在今年 4 月特斯拉的 Autonomy Day 发布会上,特斯拉 AI 主管 Andrej Karpathy 亲口证实了模仿学习的存在。
事实上,他还透露称,模仿学习已经在一定程度上用到了量产版的 Autopilot 上。
Karpathy 还坚信,当下靠手工编码的任务,未来靠模仿学习会更加出色。
显然,如果一切顺利,特斯拉也能像 DeepMind 一样在自动驾驶行业横扫一切。
更重要的是,业内根本没有什么竞争对手。
因为除了特斯拉,谁也没有 60 万辆在路上勤劳采集数据的车辆,而这些车辆每天在各种路况下能累积 2000 万英里的行驶里程。
即使强如 Waymo,手上也没有如此体量的数据集,因为 Waymo 的测试车保有量只有特斯拉车队的 0.1%。
怎样拿到真正有价值的数据?
虽然能采集数据的车辆众多,但想从这些随机上传的数据中找到有用的部分并不容易。因此,特斯拉需要找到捕捉各种不同驾驶习惯的新方式。
对大多数公司来说,手动采集是最直接的方式。
特斯拉工程师可以在系统中植入上传触发器,只要某些数据符合要求,就会自动保存并上传,比如无保护左转。
他们也确实这么做了:当车辆的视觉神经网络探测到了交通信号灯,或驾驶员向左打了方向盘,车辆就会记录下这个片段,随后通过 Wi-Fi 回传。
不过,那些工程师们想不到的行为怎么办?如果神经网络犯了错误怎么办?
在这样的情况下,Autopilot 的介入是最理想的触发器。Musk 表示,特斯拉的方法是「将这一切看作错误的输入」。
如果 Autopilot 的介入被视为错误,那么随后人类驾驶员的动作就是正确行为最好的示范。
这样一来,Autopilot 的介入就能持续提供有用的训练数据了。
当然,在驾驶员操作模式下我们也能采集训练数据。为此,特斯拉专门设计了一个「影子模式」。
The Information 在文章中对其进行了一番描述:
业内也有不少评价,认为特斯拉所谓「影子模式」对新 Autopilot 软件的开发价值不大,毕竟特斯拉本来就能在不影响车辆行驶的情况下运行各种测试软件。
Autopilot 的工程师完全可以拿测试软件的表现与车辆实际表现进行对比。在「影子模式」下,Autopilot 团队则能对人类与 Autopilot 在相同场景下的反应进行对比。
用模仿学习训练的神经网络可以在车载计算机上被动运行,同时输出它眼中的最佳选择。如果人类驾驶员有不同反应,就能触发这个片段的数据上传。
一旦出现「意见相左」,神经网络的抉择就会被判错,而驾驶员的操作则成为正确示范。
除了在人与计算机意见相左时保存数据,特斯拉还能在神经网络「怀疑」自己时保存数据。
当下,市场上已经有了不少试图量化神经网络不确定性的技术,当这个数值超过某个阀值,就会触发数据的保存和上传。
因此,从广义上来讲,特斯拉共有三种采集有价值数据的方法:
手动设定触发器;
Autopilot 介入;
被动运行的神经网络,如「影子模式」。
鉴于特斯拉的硬盘每天都能接收 2000 万英里数据,因此想采集大型数据集(包括不同的驾驶习惯和纠错示范)并不难。
不过,对 Waymo 这样两年才跑 2000 万英里的公司来说,这种方案不太实际了。
如果 DeepMind 手上只有数百个玩家的数据,它的 AI 还能制霸《星际争霸》吗?
恐怕没有希望。
这并不是小看他们,现实是当下的神经网络对数据的胃口实在是太大了。
对人来说,一个小时内学会玩《星际争霸》并非难事,但想在同样时间内训练出同样水平的神经网络,就得有数百万甚至上亿个千变万化的例子打基础。
同样的,即使神经网络能从庞大的驾驶数据中学到一些驾驶的精髓,想与人类媲美也得将错误率拉低到 0.1% 以下。
鉴于边际效益会随着数据的增多而递减,因此,只有真正海量的数据库才能解决问题。
不过,海量的数据库不是我们想搭就能搭起来的。举例来说,如果我们想要 1 万个极端情况的示例,前提是得累计 100 亿英里的行驶里程。
对特斯拉来说,是有希望实现的。因为随着新车的持续交付,未来 17 个月就能搞定 100 亿英里。
而 Waymo 现在的车队规模,实现这一目标得 800 年。
这就是特斯拉的自动驾驶解决之道:
对那些无法人工编码的驾驶任务进行模仿学习,配合计算视觉与行为预测的深度学习,以及那个无所不包的海量数据集。
一日千里的进步切合实际吗?
Musk 相信,特斯拉将在 2020 年底解决全自动驾驶问题。不过,业界普遍认为 Musk 定的时间点有些激进。
在他们看来,自动驾驶技术的开发是人工处理的过程。
按照这种理解,开发自动驾驶软件需要工程师不断对代码进行修改,因此人的速度就是天花板,即使添加更多工程师也快不了多少。
但现在还是这种思路吗?
DeepMind 为了攻克《星际争霸》,花了三年时间研究。不过,用上了模仿学习后,将 AI 训练到人类级别只用了三天。
为什么能这么快?
因为训练流程已经能自己写出《星际争霸》的对战代码,而前三年人类的工作主要是为了标定这个训练流程,特别是神经网络架构和数据集。
火箭工程师们走的也是这个路子,火箭前期的设计与建造会花费他们大量时间,几年之内甚至一点成功都见不到。
不过,当万事俱备,十秒钟的倒计时后就能见证奇迹。从时间的维度看,前几年毫无作为,最后几秒突然爆发。
事实上,研究和工程的进展都被隐藏在了幕后。
显然,现在的特斯拉正在通过一系列工作搭建自己的训练流程。
举例来说,特斯拉全新的计算硬件还没火力全开,为新硬件设计的神经网络也还在开发与测试中,他们正在为未来积聚力量。
至于今年 4 月展示的那版全自动驾驶软件,据说只是三个月神经网络训练的结果,软件开发对应的场景也相当单一。
而就在一年之前,特斯拉才刚刚掌握高速上的车道保持功能,当时特斯拉还推了一个 OTA 升级包修复了车辆在车道线间反复摇摆的漏洞。
Karpathy 指出,那次的升级,特斯拉「重写了很多东西」。从那时起,Karpathy 的团队和 Autopilot 部门的其他技术专家们一直在为 Autopilot 打地基,特别是计算视觉。
如果特斯拉不推送升级包,公众就看不到他们努力的结果。
至于一些城市驾驶功能是否适合部署,则纯粹是二进制而非增量问题,最终一切都得由特斯拉来决断,外部是根本看不到其中的渐进发展过程的。
自动驾驶经济模型
全自动驾驶汽车,不但能彻底颠覆 Uber、滴滴、Lyft 与传统出租车公司苦心建造的王朝,还能让传统的私人拥车制分崩离析。
美国汽车协会的数据显示,购买并使用一辆新车,每英里平均要花掉 0.62 美元。而投资机构 ARK 预计,自动驾驶出租车的生产与运营成本仅为 0.26 美元/英里。
如果套用 ARK 的经济模型:
「只要自动驾驶出租车公司将价格定在 0.45 美元/英里,比小型轿车稍低(拥车成本为 0.47 美元/英里),那么自动驾驶出租车每英里依然能盈利 0.19 美元。
假设一辆车每年运营 12.7 万英里(几乎是当下传统出租车运营里程的 1.8 倍),每英里收费 0.45 美元,一年利润就有 2.62 万美元。
如果有 100 万辆这样的自动驾驶出租车,就意味着能每年净赚 262 亿美元。」
但别被 100 万辆车吓住了,这个数量级的出租车根本不够用:
假设用户的出行需求维持在当下的水平,每辆自动驾驶出租车就能代替 8-9 辆常规汽车(平均每年行驶 1.35 万英里)。鉴于全球常规乘用车保有量约为 10 亿辆,因此自动驾驶出租车必须有 1.1 亿-1.25 亿辆才够用。
所以,自动驾驶行业的成长空间还很大。
不过,ARK 投资的模型中有些假设需要进行调整。
比如它将自动驾驶出租车的造价定在了 5 万美元一辆,这可比现在最便宜的 Model 3(3.9 万美元)要贵上不少。
即使 Model 3 毛利只有 5%,也能从造价中再减掉 2000 美元。对特斯拉 Network 来说,这才是更合理的数字。
对自动驾驶出租车年运营里程的假设,它应该和 Uber 与传统出租车差不多,即一年 7 万英里。
需要注意的是,即使是自动驾驶汽车,也会有空驶时间。
按 Uber 的水平看,车上有乘客的时间占到车辆运营总时间的 64%。
也就是说,每年单辆车净利润 4200 美元才更合理,100 万辆自动驾驶出租车则能净赚 42 亿美元。
当然,毛利与价格是紧密挂钩的,而 0.45 美元/英里的定价已经相当低廉。如前所述,私家乘用车平均每英里要的价格是 0.62 美元。
如果打车费用定在 0.6 美元/英里,相同的特斯拉车型每年能净赚 1.08 万美元。
无论怎么计算,自动驾驶出租车都会成为成本大杀器:
首先,这些车辆的性质意味着它们的成本会分摊到很多乘客身上。
其次,自动驾驶汽车不需要司机。
另外,我们还得关注车辆寿命。
一辆传统燃油车,20 万英里后的维保成本会迅速攀高。电动车在这方面有优势,比如当下特斯拉电池组使用 50 万英里没有问题。
这也就意味着,普通用户得驾驶 37 年才能耗尽特斯拉电池组的寿命。而 100 万英里使用寿命的特斯拉新车也正在开发中。
简言之,自动驾驶出租车能解锁电动车潜在的有形资产:电动车的电池组寿命不会轻易被浪费。
不过,自动驾驶出租车和电动汽车之间的协同作用在最初可能并不明显。在这样的情况下,只要延长车辆寿命周期,才能转化为相当可观的经济价值。
如果电池和电动机的提升和改进,能为电动车增加 20 万英里的寿命,在经济上就相当于让一辆车变两辆车。
这对汽车厂商来说,少卖车等于是革了他们的命。从消费者角度考虑,一辆车开上 30 年恐怕也会是一个噩梦,毕竟在这么长时间的跨度里,汽车在各项功能上都会有脱胎换骨的提升。
但对自动驾驶汽车来说,这根本不是问题。这也是华尔街巨鳄们(麦肯锡、瑞银、摩根斯坦利等)普遍长期看好自动驾驶出租车的原因,其市场规模将达数千亿甚至上万亿美元。
如果自动驾驶汽车真能如约部署,不但会让司机们丢了饭碗,还会逐步吞掉整个汽车行业。
不过,即使到了现在,也有人怀疑这项技术的可行性:特别是近期和中期深度学习能否与人类的视觉、行为预测和驾驶能力所匹敌。
这个问题目前谁也回答不了,但我们依然能从这个趋势中看出一些端倪:
首先,如果深度学习能在近期和中期解决这些问题,特斯拉将成为自动驾驶技术的正名人。
其次,如果特斯拉实现了全自动驾驶,从外人的眼光来看,特斯拉像开了外挂一样,佛挡杀佛。
总之,特斯拉在自动驾驶上的新「套路」让我们重新认识了技术进步。
前期的缓慢开发并不意味着后续的拖沓,一个花费数年时间搭建的神经网络可能在几天内就能完成训练。而自动驾驶,有可能仅需一个 OTA 的时间,就如期而至了
责任编辑:ct
评论
查看更多