高工年会演讲回顾：超级算力，赋能整车中央计算-电子发烧友网

当下的智能电动汽车时代，已经进入智能网联决胜的下半场，高算力芯片成为衡量汽车企业产品水平高低的重要指标之一，算力配置也成为了车企在车型规划中的关键要素。此外，随着芯片算力的提升，以及汽车应用复杂化，各功能域互相渗透，域集中式的控制架构成为一个演进趋势。

在上周举行的 2022（第六届）高工智能汽车年会暨年度金球奖评选颁奖典礼上，NVIDIA 中国区软件解决方案总监卓睿分享了以“超级算力，赋能整车中央计算”为题的演讲，介绍 NVIDIA 在这个背景下如何布局并做出了哪些探索。以下为内容概要。

智驾和智舱融合趋势突显

近年来，随着汽车电子电气架构由传统的分布式架构向中央集成式架构演进，车内电子控制单元（ECU）数量逐渐减少。随着芯片算力的不断提升，自动泊车以及高级驾驶辅助系统（ADAS）等功能得以整合。

当前，汽车制造商和一级供应商希望能够将智驾和智舱功能进行进一步融合。目前已经有客户将基于 DRIVE Orin 的智驾芯片与相关厂商的座舱芯片集成至一块 PCB 中或同一 ECU 中的不同 PCB 上。这种不同的技术趋势的出现，意味着在不远的将来，汽车内部与智能功能相关的域控制器数量将会进一步减少，芯片将大放异彩。

DRIVE Orin 踏浪争先

强劲赋能自动驾驶

从去年开始，很多中国车企都采用了NVIDIA DRIVE Orin SoC。DRIVE Orin Soc 的算力达到 254 TOPS，内存带宽被设定在 205GB/s，可以支持各种传感器和 4 个 10G bps 的网络接口，以及 H.265/HEVC/VP9 格式的 4K@60Hz 视频编码或者 8K@30Hz 视频解码。

DRIVE Orin 集成了新一代 GPU 体系架构，GPU 凭借其灵活性，可支持无人驾驶领域的算法团队开发新的算法。另外，GPU 虽然非常灵活，但本身从能耗比来说表现还不是最好，所以 NVIDIA 又加入了 DLA（Deep Learning Accelerator，深度学习加速器）。NVIDIA 将 GPU 与 DLA 相结合，帮助客户能够更加灵活地将不同算法部署在不同引擎上，以达到更好的功耗比和性能表现。

除 AI 计算能力之外，对芯片而言，CPU 也至关重要。目前，NVIDIA 软件团队正在持续优化 CPU 算力，将需要并行的算力从 CPU 迁移到 GPU 和 DLA。此外，DRIVE Orin 芯片属于异构的计算架构，配置了许多性能卓越的加速引擎，如适用于传统的 CV 算法的 PVA 引擎，可用于深度学习的前处理和后处理的加速。

此外，DRIVE Orin 的带宽也值得一提，其高达 254 TOPS 的算力都需要通过内存加载，如果带宽速度相对较慢，就意味着带宽才是真正的算法瓶颈。DRIVE Orin 可支持 205 GB/s 的带宽，可避免由于带宽不足造成的瓶颈。

现阶段，通过单个或两个 DRIVE Orin，不仅可以将标准的 ADAS 功能提升，应用于高速公路或城市道路等场景，还可以将 360 度环视、编码、自动驾驶监测以及泊车功能集成至 DRIVE Orin 中，而这个集成的实现得益于算力的提升和芯片功能的逐步强大。

DRIVE Thor 蓄势待发

推动实现舱驾一体融合

DRIVE Orin 是 NVIDIA 推出的第三代无人驾驶车载芯片。NVIDIA 发布的第一代 Parker 更多是基于 Linux 打通数据链路，例如摄像头获取数据后的前处理和推理等，但欠缺真正的功能安全。因而虽然被大量厂商作为开发板，但 Parker 并没有在无人驾驶领域实现量产。NVIDIA 在 Parker 之后带来了下一代产品—DRIVE Xavier，该产品在国内已有量产。DRIVE Xavier 有超过 90 亿个晶体管，是全球第一个达到 ISO 26262 安全认证的复杂 SoC。DRIVE Orin 相比于第二代产品 DRIVE Xavier，算力水平有了进一步提升，同时架构和软件也拥有延续性，在国内自动驾驶行业占据主流。

今年 GTC 秋季大会上发布的可实现 2000 TFLOPS 浮点算力的 DRIVE Thor，相比前三代产品而言变化较大。前三代产品主要用于解决智能驾驶的应用场景，而 DRIVE Thor 在此基础上，还将推动实现智能座舱。在硬件层面，DRIVE Thor 利用 MIG 技术，实现 GPU 硬件在智驾域和智舱域的隔离；在软件层面，DRIVE Thor 通过虚拟化的技术，保证渲染与 AI 功能在智舱域的并行，“软硬共进”，实现舱驾一体融合。

DRIVE Thor 内含 780 亿个晶体管，主要有三项优势（如上图）。

FP8 的支持

DRIVE Thor 的优势之一是具有 8 位浮点（FP8）精度。FP8 是 NVIDIA 积极推动的一种新型的数据处理方式，其目的在于贯通软件和硬件提供一个通用、可维持准确性的交换格式，以加速 AI 的训练、推理。传统意义上讲，开发人员在从 32 位浮点转换成 8 位整数（8-int）的数据格式时，往往会损失神经网络的准确性。DRIVE Thor 在 FP8 精度下 2000 TFLOPS 的浮点算力，让开发人员在不牺牲精度和准确性的情况下进行数据传输。事实上，FP8 的主要目的是支持推理 Transformer 引擎的自动驾驶汽车平台，该引擎是 NVIDIA GPU 中 Tensor Core 的新组件。借助该引擎，DRIVE Thor 可将 Transformer 深度神经网络的推理性能提升高达 9 倍，这对于支持与自动驾驶相关的、庞大且复杂的 AI 工作负载至关重要。

多域计算

DRIVE Thor 支持多域计算，可隔离用于自动驾驶和车载信息娱乐的功能。车辆中通常会分布数十个 ECU 来为各个功能提供支持，借助 DRIVE Thor，汽车制造商可以在单个系统级芯片（SoC）上高效整合多种功能，可满足智能座舱和智能驾驶对 GPU 不同的安全性和稳定性的需求，能够缓解算力供应紧张并简化车辆设计开发，从而进一步显著降低运行能耗、减轻重量并减少布线。

NVLink-C2C 芯片互联技术

DRIVE Thor 还采用了最新的 NVLink-C2C 芯片互联技术，可同时运行多个操作系统。用户可以单独使用 DRIVE Thor 芯片，也可以通过最新的 NVLink-C2C 芯片互连技术同时连接两个 Thor 芯片，使两个芯片作为单一操作系统的统一平台。

NVLink-C2C 的优势在于它能够以最小的开销在超高速数据传输链路中共享、调度和分发任务。在软件定义汽车的发展趋势下，这为汽车制造商带来足够大的算力冗余和灵活性，支持软件定义车辆的开发，这些车辆可通过安全的 OTA 更新持续升级。

软件赋能“行稳致远”

那么如何让中央域控制的芯片更富竞争力呢？除了硬件的支持外，软件赋能也必不可少。无论是 DRIVE Orin 还是 DRIVE Thor，都是 SOA 架构，该架构拥有很强的延续性。该部分着重介绍以下几点：

DRIVE Orin 和 DRIVE Thor 的 API，也就是所谓的中间件，以及底层的大部分架构非常相似，可支持有 DRIVE Orin 开发经验的开发人员，将其开发的代码轻松迁移至 DRIVE Thor。
基于 NVIDIA DRIVE OS 的经验。DRIVE Orin 和 DRIVE Thor 均支持基于 Hypervisor 的 Guest OS 架构。客户可根据场景的需要，灵活地配置一个或者多个 Guest OS 作为操作系统。
安全标准受重视程度逐渐提高，厂商也更加关注安全需求。NVIDIA 在软硬件方面都进行了功能安全性的提升。
随着芯片逐渐开始支持多域计算，虚拟化的重要程度也不断提升。当前，NVIDIA 可利用自有的 Hypervisor 实现虚拟化，避免不同模块之间产生干扰，实现资源隔离。

DRIVE Orin 是利用了相同的 Hypervisor，其 ADAS 功能可根据客户需求选择 Linux 或 QNX 作为操作系统。当前国内主流选择是 QNX 系统，但仍有不少数客户选择使用 Linux。NVIDIA 与黑莓（BlackBerry）进行了深度合作，通过 QOS 版本满足 ASIL－D 级别的功能安全。

在 DRIVE Thor 中，用户可整合仪表盘、车载信息娱乐（IVI）等功能。因此，可以支持三个 Guest OS 来满足不同域的需求。

NVIDIA 对于深度学习领域关注的不仅仅是 TOPS 算力本身。如图所示是 NVIDIA 每一代芯片产品最高可达的算力水平，在此基础上还需考虑带宽以及可编程性等。对于可编程性而言，NVIDIA CUDA 架构可支持业界流行的 TensorFlow、PythonTorch 等典型训练框架，拥有良好的可编程性。

而编译器实际上是一个推理架构，能够优化以 Python 或 Tensorflow 输入的网络架构，包括对 Layer 的融合，精度的优化等，能够在保证准确性的同时大幅提升性能。NVIDIA 支持不同的网络，包括检测、分类、Transformer 和对话式 AI 等。因为目前智能座舱的对话式 AI 部署很多是基于云上进行的，希望未来客户能够借助 NVIDIA 提供的算力支持，将他们部署在云端的算法部署在 DRIVE Thor 中。

除上文提到的 DRIVE OS 以外，NVIDIA 还将在 DRIVE Orin 和 DRIVE Thor 等产品中延续使用 NVIDIA DRIVE SDK 和 CUDA 架构。SDK 的延续，可赋能应用迁移，如将基于 DRIVE Orin 开发的应用轻松迁移至 DRIVE Thor 平台。如 NvMedia 可用于收集传感器数据并无缝传输至 GPU 引擎和 DLA 引擎中，而 NvStreams 则相当于一个用于内存管理和传输的 SDK，可以实现不同应用场景之间的数据传输，包括跨线程、跨进程和跨 VM 之间的传输。

原文标题：高工年会演讲回顾：超级算力，赋能整车中央计算

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3858

浏览量
92164

原文标题：高工年会演讲回顾：超级算力，赋能整车中央计算

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

从堆算力到用算力，宁畅用精装算力，助力产业打造智能化摩天大楼

算力

脑极体

发布于 :2025年01月22日 00:00:50

算智算中心的算力如何衡量？

作为当下科技发展的重要基础设施，其算力的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智算中心算力衡量的详细阐述：一、算

发表于 01-16 14:03 •639次阅读

算家计算开启贵州人工智能算力服务新篇章

伴随数字化转型加速及 “人工智能 +” 行动规划的推进,算力已成企业创新与业务增长的关键驱动力,其市场需求暴增,企业亟需高效经济的算力解决方案。在此背景下,由贵州省贵安

发表于 12-27 00:37 •246次阅读

海辰储能荣获2024高工金球奖两大奖项

近日，由高工储能和高工产业研究院（GGII）联合主办的2024高工储能年会在深圳盛大召开。在同期

发表于 12-18 14:00 •260次阅读

燧原科技入选先进计算赋能新质生产力典型应用案例

近日，工业和信息化部电子信息司发布了《先进计算赋能新质生产力典型应用案例公示》，燧原科技“基于国产云端算

发表于 12-04 15:26 •444次阅读

亿纬锂能受邀出席2024高工锂电年会

近日，亿纬锂能董事长刘金成博士在2024高工锂电年会上，发表了题为《守正创新，是走出周期的正确道理》主题演讲，深度阐释了锂电产业的发展趋势、企业使命以及技术创新的重要性。

发表于 11-29 17:46 •566次阅读

本源“量超融合先进计算平台”入选2024算力中国·年度重大成果

近日，2024中国算力大会在河南郑州开幕。大会主论坛上，“算力中国·年度重大成果”正式发布8项具有突破性意义的技术成果。本源量子与郑州大学国家超级

发表于 10-16 08:06 •457次阅读

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

、GPU、NPU,给我们剖析了算力芯片的微架构。书中有对芯片方案商处理器的讲解，理论联系实际，使读者能更好理解算力芯片。全书共11章，

发表于 10-15 22:08

稳定、高效、低成本，储能与算力正在相互赋能

中心等算力基础设施的迅猛发展正推动着储能技术的应用进入一个新的阶段。储能为数据中心赋能过去一段时间，能源领域中流传着这样一句话—

发表于 10-09 00:08 •4842次阅读

算力的分类与现代生活

力的提升使得用户能够享受到更加流畅和丰富的数字体验。个人算力通常指的是个人使用的计算设备，如智能手机、个人电脑、平板电脑等。这些设备通过中央

发表于 08-26 15:05 •291次阅读

算能亮相第七届数字中国建设峰会，以算力赋能千行百业

5月23日，以“释放数据要素价值发展新质生产力”为主题的第七届数字中国建设峰会于福州拉开帷幕，算能受邀出席并亮相展会，活动期间，算能展区吸引

发表于 05-29 08:33 •611次阅读

马斯克欲建xAI超级算力工厂

在最近的一次投资者演讲中，人工智能创业公司xAI的创始人马斯克公布了公司的最新宏大计划。他宣布，xAI计划打造一个由数万个专用算力芯片组成的超级计算

发表于 05-27 10:29 •651次阅读

中科创达全球首发面向中央计算的AI原生整车操作系统—滴水OS

2024年4月26日，作为全球领先的智能操作系统及端侧智能产品和技术提供商，中科创达在北京国际车展上全球首发面向中央计算的AI原生整车操作系统——滴水OS，旨在赋

发表于 04-28 09:58 •1006次阅读

DPU技术赋能下一代AI算力基础设施

4月19日，在以“重构世界奔赴未来”为主题的2024中国生成式AI大会上，中科驭数作为DPU新型算力基础设施代表，受邀出席了中国智算中心创新论坛，发表了题为《以网络为中心的AI算

发表于 04-20 11:31 •967次阅读

中国移动发布基于飞腾CPU自主研发的赋能AI算力时代的新产品

4月16日，在中国南京举办的 “2024 全球 6G 技术大会”上，中国移动发布了基于飞腾 CPU 自主研发的赋能 AI 算力时代的新产品——“灵云” 无线通

发表于 04-17 18:12 •1537次阅读