特斯拉全新的训练计算机Dojo正在开发中?-电子发烧友网

在刚过去的8月，马斯克在推特上公布了关于 Autopilot 以及 FSD 的两条重要消息：

AP 团队正对软件的底层代码进行重写和深度神经网络重构；全新的训练计算机 Dojo 正在开发中。

重写 AP，是今年马斯克在推特上不断提及的一项重要行动。在回应推友提问时，马斯克会时不时披露 AP 将有的新功能，比如：

对路面上的隆起和坑洞（bumps&patholes）的识别；

对环岛路况（roundabouts）的处理等等。

特斯拉对 AP 的全面重写，包括了对数据标注、训练、推理全流程的重构。

而基于新架构的 FSD 将不再是渐进式的优化，而是一次「量子式跃升」（马斯克原文是 quantum leap）。马斯克在7月的世界人工智能大会上表示「有信心在今年完成开发L5级自动驾驶的基本功能」，马斯克能够实现他的承诺吗？

特斯拉为什么要在这个阶段对 AP 软件进行重写？重写 AP 到底要重写些什么呢？作为当下市面上量产最强的自动驾驶系统，AP 走向何方，FSD 何时到来？

特斯拉 AP 两大新进展

身兼特斯拉 AP 团队的最高负责人，马斯克经常充当着软件测试员的角色。根据马斯克在推特上透露，他本人经常开着搭载 FSD 最新测试版本的特斯拉上下班，马斯克称在他使用系统的过程中，几乎不需要人工接管。

基于此，他乐观估计，最快在6-10周后（也就是10月-11月份），就可以向小规模地向用户推送 FSD 测试版本。

作为重写 AP 的一部分，马斯克还向外界介绍了其全新的用于神经网络（NN）训练的超级计算机 Dojo。 Dojo 在日语中意为「道场」，现在它成为了特斯拉训练数据的「道场」。

Dojo 将专门用于大规模的图像和视频数据处理，其浮点运算能力达到了 exaflop 级别，也就是每秒运算百亿亿次。正因此，马斯克称 Dojo 如野兽一般。

需要注意的是，Dojo 计算机将配合无监督学习算法（unsupervised learning），来减少特斯拉对于数据人工标注的工作量，这样来帮助其数据训练效率实现指数级提升。马斯克还在推特上发布英雄帖，为自家的 AI 和芯片团队招人。

目前，Dojo 计算机仍在开发中，从 V1.0 开始，大约一年后才会有成果。

有了全新的 AP 软件架构以及强大的数据训练计算机 Dojo，难怪马斯克会对其 FSD 的落地进展如此自信。但话说回来，特斯拉为什么要在这个阶段对 AP 软件进行重写？还是以这样一种推倒重来的方式。

为什么特斯拉要重写 AP？

现在的 AP 已经碰到了性能瓶颈，必须要进行升维革命，否则难有大的突破。

马斯克用了一个术语来表述这个问题，他认为过去 AP 被困在一个局部最大值（Local Maximum）里面，要向上突破已经非常困难了。

其中一个很关键的问题在于，原有 AP 软件架构下，其处理的数据都是不含有时间坐标的 2D 图像数据。再想往上去处理 3D 甚至 4D（加上时间维度）的数据，实现从图像级处理到视频级处理的跃迁， AP 固有的软件和训练网络难以胜任。

关于引入 4D 数据带来的影响，一位来自国内自动驾驶公司的工程师向汽车之心分析：

因为有了时间维度，系统就能知道目标物的运动，对其行为进行预测，而且，系统处理目标物识别、分类以及场景的重构这类任务会更加轻松。

总之，加入时间维度，很大程度上是提高系统对整体场景的理解。 AP 要再往前走，必须进行革命，所以特斯拉这才决定重写 AP。

另一方面，因为数据转变成 4D，信息量更丰富，整个数据的容量也会变大，这也给特斯拉 AP 现有的用于深度神经网络训练的基础设施带来了挑战，所以就有了 Dojo。所以， AP 为了实现性能和功能上更大的突破，倒逼其对 AP 基础代码以及训练深度神经网络的基础设施进行重构。

这样工作量庞大的复杂工程也成为 FSD 迟迟推出不了落地版本的重要原因。

除了在车载软件和训练服务器端变革，特斯拉在车载硬件端也做好了准备，就是其自研的 FSD 芯片。

FSD 已经在去年4月份开始量产并搭载在特斯拉的车端。一位对熟悉特斯拉的业内人士表示：

在 FSD 发布后的一段时间里，特斯拉 AP 团队仍是基于 HW 2.x 的硬件（英伟达 Drive PX 平台）进行功能开发，直到今年年初，特斯拉才开始全面转向基于 FSD 芯片的软件开发。

相较于英伟达 Drive PX 平台，特斯拉 FSD 芯片在基础算力和深度神经网络推理效率方面都有革命性提升，而且在视觉处理性能上，FSD 相较于英伟达的芯片有更大的优势。

所以趁着这一次特斯拉重写 AP，整个系统需要处理的数据升维到了 4D，对计算硬件的要求指数级提高，FSD 的强大性能便终于有了广阔的用武之地。

引入 FSD 芯片的 AP 在性能上会有多大提升？马斯克此前在接受 Youtube 视频博主采访时透露过：

如果特斯拉全车的 8 颗摄像头以36帧/秒的速度运行（性能拉满），软件则会基于 FSD 芯片的算力同步进行 3D 标注（2D 图像+深度信息），这会使标注效率提升3倍，准确性也会大幅提升。

特斯拉重写 AP，除了马斯克口中所说的要突破「Local Maximun」以及挖掘 FSD 芯片的极限性能这两方面的原因之外，还有一种可能性存在。硅谷一位资深自动驾驶工程师告诉汽车之心：

特斯拉现有的 AP 系统和后续要推出的 FSD 是两套独立开发的系统。

前者的架构是针对于 L2/L3 级自动驾驶，而 FSD 的目标从一开始就是 L4/L5 级自动驾驶。因此，两套系统在架构上有本质的差异，两者差着一个代际。

后续，随着技术不断进步，FSD 也走向成熟，特斯拉决心把 FSD 和 AP 的框架进行整合。但问题是，两个系统中有些模块可以融合，但是有些模块是融合不了的，毕竟一个为 L2 开发的系统很难直接演变成 L4 系统。所以特斯拉 AP 团队要改写 AP 软件的框架和代码，以实现两个系统间的完美兼容，这样的话，后续才能以统一的版本推送给购买了全自动驾驶选装包的特斯拉车主。

实际上，我们也能从 AP 这些年的功能更新中发现一些蛛丝马迹：

2017年3月，推送自动泊车和自动辅助变道功能；

2018年10月，推送自动辅助导航驾驶（NoA）功能；

2019年9月，推送智能召唤（Smart Summon）；

2020年4月，推送识别交通信号灯和停车标志并作出反应（海外先行）。

AP 还在最新的迭代过程中更新了一些令人惊喜的小功能：

比如在城市工况施工区域，没有车道线的情况下，车身两侧皆为锥形桶，AP 能做到以锥形桶为依据实时绘制车道线。 AP 系统还能检测到小动物并及时进行避让，不过特斯拉是把小动物一律识别成人后才做出相应的操作。

基本上，在特斯拉官网上标明的 FSD 完全自动驾驶功能，还剩下一项最难的、也最能代表 L4 级自动驾驶能力的更新：在城市街道中进行自动辅助驾驶。为了实现这一难度最大的更新，特斯拉给出的最优解就是重写 AP。

基于以上分析，特斯拉重写 AP 的原因便包括突破「Local Maximun」、挖掘 FSD 芯片的极限性能以及将系统能力从 L2 进化至 L4。

特斯拉重写 AP，是重写什么？

先来看看特斯拉 AP 现在最新的 AI 软件堆栈是怎么样的：

最底层的是数据、GPU 集群以及 Dojo 计算集群，这一层主要进行数据采集、标注和训练，生成算法模型；

往上走就是采用深度神经网络对模型进行分布式训练；再往上走就是用损失函数对模型进行评估；

在评估层之上，是云端推理层和车端 FSD 芯片推理层，到这一层，意味着算法模型走完了大部分流程，然后就是部署到车端；

在车端，特斯拉通过影子模式（Shadow Mode）将这些算法模型与人类驾驶行为进行比对，检测是否存在异常。

这样的从数据采集到算法部署的闭环，目的就是让系统性能不断迭代，更加优秀。

在这个闭环当中，涉及到数据集、模型训练神经网络、云端和车端推理算法等等要素。

所以，当数据形式从二维的图像数据（2D）转换成四维的视频级数据（4D）后，相应的神经网络和推理算法都需要进行重写。

据马斯克透露，特斯拉 AP 新版本的深度神经网络会将包括感知、路径规划、目标识别等所有子神经网络综合于一体。

特斯拉AI高级总监 Andrej Karpathy 在此前的一次演讲中表示：

我们无法让每一个任务都享有单独的神经网络运算，因为同时处理的任务数实在太多，我们只能把一些运算分摊到共享骨干网络上。

Andrej Karpathy 将这一骨干网络称为 HydraNets（Hydra 意为九头蛇），意思就是有一个主干网络（Backbone），在这个网络上有多个不同的出口（Head）来做应用，然后输出各自的结果。

在特斯拉 AP 最新的 AI 软件堆栈中，有一个最值得关注的部分就是 Dojo 训练集群，这个集群可以处理海量的图像、视频数据。

引入这一训练计算机，一方面是为了满足特斯拉 AP 系统此后的 4D 视频数据处理需求。

另一方面，特斯拉在全球有超过 82 万辆搭载 HW 2.0/3.0 硬件的车辆每天在道路上行驶，可以采集海量的数据用于 AP 的训练，而如此海量的数据，必然需要具备强大计算性能计算机来进行处理。

Dojo 还有一个特别之处在于，它可以与无监督学习进行配合。所谓无监督学习，就是无需人工对训练数据集进行标注，系统可以自行根据样本间的统计规律对样本集进行分析，常见任务如聚类等。

例如无监督学习在不给任何额外提示的情况下，仅依据一定数量的「狗」的图片特征，将「狗」的图片从大量的各种各样的图片中将区分出来。

有了无监督学习技术加持的 Dojo 计算机，便能以极低的成本对数据进行自动标注和训练，实现算法性能的指数级提高。

不过，用上了无监督学习技术的特斯拉，依然有一支大约500人规模的数据标注团队。

因为在一些初始神经网络模型的搭建过程中，采用人工标注的方式置信度更高。而且，特斯拉并未大规模采用无监督学习技术，现在都还处在尝鲜阶段。

那么，Dojo 计算机上搭载的会是谁家的芯片呢？目前特斯拉自研的 FSD 芯片属于推理芯片，用于 Dojo 计算机的芯片属于训练芯片。

有业内人士向我们分析表示，Dojo 所采用的芯片应该是 FSD 芯片的扩展版本。这也是为什么马斯克在为自家 AI 和芯片团队招人时，特意公布了其在研发的 Dojo 计算机的情况，大概率要招的人就是为了研发用于 Dojo 计算机的芯片。

特斯拉 FSD 走向何方

无论是大力投入资源重写 AP 基础代码和深度神经网络，还是广纳贤才开发性能强大的数据训练计算机 Dojo，都体现了特斯拉要先人一步搞定完全自动驾驶的决心。

特斯拉拥有庞大规模的数据采集车队，也聚集了 300 多位全球顶尖的自动驾驶和深度学习方面的软硬件研发人才，从数据到算法到商业化，特斯拉在自动驾驶领域有着其他厂商无法比拟的优势。

在这些优势的加持之下，特斯拉仍然迟迟无法量产真正意义上的完全自动驾驶功能，那些买了 FSD 选装包的特斯拉用户着急，马斯克则更急。

所有人都在期待着重写完成后的 AP 系统能真正进化至 FSD 版本，而这一切都要等到今年年底见真章。在重写 AP 的同时，特斯拉也没有停止在硬件层面的持续研发。

据媒体报道，特斯拉正与博通合作研发新款 HW 4.0 自动驾驶芯片，其性能比 FSD 还要强大 3 倍，计划明年第四季度进行大规模量产，由台积电负责生产。特斯拉在 AP 层面，是一个接一个的大动作，而这一切动作都有一个统一的目标：更优秀的 AP、更强大的 FSD。

即使现在其表现还不尽如人意，但未来值得期待。
责任编辑：tzh

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片

芯片

+关注

关注
453

文章
50387

浏览量
421776
神经网络

神经网络

+关注

关注
42

文章
4762

浏览量
100535
计算机

计算机

+关注

关注
19

文章
7418

浏览量
87709
AI

AI

+关注

关注
87

文章
30106

浏览量
268391
自动驾驶

自动驾驶

+关注

关注
783

文章
13682

浏览量
166127

特斯拉2025年末批量装备Dojo 2 AI训练芯片

在近期举行的All-In Summit 2024活动上，特斯拉CEO埃隆·马斯克透露了公司AI技术发展的最新蓝图。他宣布，特斯拉下一代AI训练芯片——Dojo 2，预计将于2025年末

发表于 09-12 17:39 •561次阅读

DRAM在计算机中的应用

DRAM（Dynamic Random Access Memory，动态随机存取存储器）在计算机系统中扮演着至关重要的角色。它是一种半导体存储器，用于存储和快速访问数据，是计算机主内存的主要组成部分。以下是对DRAM在

发表于 07-24 17:04 •915次阅读

计算机系统中的关键组件有哪些

在计算机系统中，关键组件的协同工作构成了其强大的数据处理和运算能力。这些组件不仅决定了计算机的性能，还影响着用户的使用体验。以下是对计算机系统中

发表于 07-15 18:18 •1281次阅读

工业计算机与普通计算机的区别

在信息化和自动化日益发展的今天，计算机已经成为了我们日常生活和工作中不可或缺的工具。然而，在计算机领域中，工业计算机和普通计算机虽然都具备基

发表于 06-06 16:45 •1203次阅读

【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

大语言模型训练会是一个怎样的情景。。。。。。希望量子计算机尽快走出实验室，能够早日进入寻常百姓家，更希望我国的量子计算机取得突破，蓬勃发展，也能遥遥领先！今天先研读至此，后续所读所感将继续分享。附

发表于 03-05 17:37

全球大厂自研芯片进度分析

特斯拉以自动驾驶需求为主，至今推出两种AI芯片，分别是全自动驾驶的FSD芯片和Dojo D1芯片。FSD 芯片用于特斯拉车自动驾驶系统，Dojo D1 芯片用于

发表于 02-20 09:41 •284次阅读

Tesla 计划斥资 5 亿美元建造一台由 NVIDIA 的 AI GPU 提供支持的 Dojo 超级计算机

ABSTRACT摘要Tesla计划斥资5亿美元建造一台由NVIDIA的AIGPU提供支持的Dojo超级计算机，因此该公司正在加大基于AI的开发力度。JAEALOT2024年1月27日T

发表于 02-19 12:45 •540次阅读

特斯拉将在纽约州打造Dojo超级计算机

特斯拉近日宣布，将在美国纽约州布法罗市投资5亿美元，建造一台名为“Dojo”的超级计算机。这一决策源于纽约州稳定的电力供应、杰出的人才储备以及满足项目需求的充足空间。

发表于 02-01 10:32 •625次阅读

特斯拉将斥资5亿美元建造Dojo超级计算机

据外媒报道，特斯拉将在其位于纽约布法罗的超级工厂投资超过5亿美元，建造一台名为Dojo的超级计算机。这一举措旨在推进特斯拉的自动驾驶汽车计划。

发表于 01-29 11:26 •664次阅读

特斯拉在布法罗超级工厂投资5亿美元建造Dojo超级计算机

霍楚尔表示，此次项目投资为5亿美元，并将同时在纽约州立大学建设另一台独立的AI超级计算机。“我很荣幸地告诉大家，特斯拉将在布法罗投资5亿美元，用于其新一代超级计算机的建设”，她说道。

发表于 01-29 10:58 •386次阅读

微机原理和计算机组成原理的区别

微机原理和计算机组成原理是计算机科学中两个重要的主题，它们虽然有一定的关联，但也存在一些区别。本文将详细阐述微机原理和计算机组成原理的区别，并从不同的角度对它们进行分析比较。首先，我

发表于 01-14 14:56 •3179次阅读

量子计算机的作用有哪些

认为是未来计算机技术的重要发展方向。一、量子计算机的基本概念量子计算机的核心是量子比特，与经典计算机中的比特不同，量子比特可以同时处于0和1的状态，这种现象被称为“叠加态”。此外，

发表于 12-30 14:32 •1821次阅读

工业计算机与商用计算机的区别

与商用计算机的区别。一、功能和设计工业计算机通常用于工业控制和自动化系统中，其主要功能是提供数据采集、实时控制和监测等功能。它们通常需要具备高可靠性、稳定性和冗余性，以适应恶劣的工业环境。工业

发表于 12-27 10:50 •592次阅读

特斯拉超级计算机Dojo项目负责人离职，对自动驾驶技术影响显著

该超级计算平台 Dojo 专为人工智能机器学习研发，旨在提升特斯拉自动驾驶的视觉技术。值得注意的是，Dojo 使用了由 Ganesh、Peter 及其他行业精英设计的定制 D1 芯片。

发表于 12-11 16:04 •457次阅读

特斯拉Dojo超级计算机项目负责人离职，前苹果高管接任

特斯拉Dojo项目使用公司自主开发的芯片处理特斯拉汽车的大量数据和视频，并训练公司自主开发的自动

发表于 12-08 10:15 •371次阅读

搜索历史

特斯拉全新的训练计算机Dojo正在开发中?

评论

特斯拉2025年末批量装备Dojo 2 AI训练芯片

DRAM在计算机中的应用

计算机系统中的关键组件有哪些

工业计算机与普通计算机的区别

【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

全球大厂自研芯片进度分析

Tesla 计划斥资 5 亿美元建造一台由 NVIDIA 的 AI GPU 提供支持的 Dojo 超级计算机

特斯拉将在纽约州打造Dojo超级计算机

特斯拉将斥资5亿美元建造Dojo超级计算机

特斯拉在布法罗超级工厂投资5亿美元建造Dojo超级计算机

微机原理和计算机组成原理的区别

量子计算机的作用有哪些

工业计算机与商用计算机的区别

特斯拉超级计算机Dojo项目负责人离职，对自动驾驶技术影响显著

特斯拉Dojo超级计算机项目负责人离职，前苹果高管接任