0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Dojo对标A100性能强劲,AI应用场景拓展

智能计算芯世界 来源:智能计算芯世界 2023-09-23 09:45 次阅读

D1 芯片对标英伟达 A100。D1采用台积电 7nm 制程,面积约为 645mm²,包含 500 亿颗晶体管,BF16、CFP8 算力可达 362TFLOPS,FP32 算力可达 22.6TFLOPS。特斯拉D1芯片对标英伟达 A100,英伟达 A100 同样采用台积电 7nm 制程,面积为 826mm²,晶体管数量达 542 亿颗,FP32 峰值算力为 19.5TFLOPS。

59ad8a8e-59a0-11ee-939d-92fbcf53809c.png

D1 芯片依次组成 Tranining tile、Tray、机柜、ExaPOD。特斯拉并未将 SoC 从晶圆上切下来,而是将所有 SoC 连接。25 个 D1 芯片组成了一个 Training Tile 多晶片模组(MCM),每个 D1 芯片功耗 400W,一个 Training Tile 功耗为 15kW。此外,6 个 Training Tile 组成一个 tray,再由两个 Tray 组成一个机柜,10 个机柜组成 ExaPOD,BF16/CFP8 峰值算力达到 1.1EFLOPS(百亿亿次浮点运算),并拥有 1.3TB 高速 SRAM 和 13TB 高带宽 DRAM

59cb210c-59a0-11ee-939d-92fbcf53809c.png

59f03168-59a0-11ee-939d-92fbcf53809c.png

Dojo 的设计思想是通过较高的对称性来实现 scale out 能力。在单个 Training tile 上,由于并未将芯片切下,为了提高效率和降低成本,特斯拉并未在片上集成 DRAM 等器件,这与许多通用 GPU 有所不同。集群节点之间以 2D mesh 连接,边缘则通过 Interface-processors负责内存池数据搬运。

5a1509c0-59a0-11ee-939d-92fbcf53809c.png

显而易见,D1 芯片需要高速的互联来实现,台积电 SoW 封装技术提供了这一条件。InFO_SoW 取消了衬底和 PCB 的使用,使得多个芯片阵列使解决方案获得晶圆级优势,以获得低延时、高带宽等优势。此外除了异构芯片集成外,其 wafer-field 处理能力还支持基于小芯片的设计,以实现更大的成本节约和设计灵活性。

5a35090a-59a0-11ee-939d-92fbcf53809c.png

在部分模型上,Dojo 能实现相对 A100 更高的性能。例如在图像分类模型 ResNet-50 上,Dojo 可以实现比英伟达 A100 更高的帧率。而在用于预测汽车周围物体所占空间的神经网络模型 Occupancy Networks 上,相比英伟达 A100,Dojo 能实现性能的倍增。

5a55532c-59a0-11ee-939d-92fbcf53809c.png

特斯拉将大力投资基础设施,2024 年有望达 100Exa-Flops 算力。特斯拉目前 AI 基础设施较少,仅约 4000 个 V100 和约 16000 个 A100。而 Microsoft 和 Meta 等公司拥有超过 10万个 GPU。据特斯拉规划,2024 年有望达 100Exa-Flops 算力。

特斯拉拥有海量数据库,数据价值亟待挖掘。Model3 传包含 8 个摄像头,1 个毫米波雷达,12 个超声波雷达,位置分别为:1-车牌的上方装有一个摄像头;2-超声波传感器(如果配备)位于前后保险杠中;3-各门柱均装有一个摄像头;4-后视镜上方的挡风玻璃上装有三个摄像头;5-每块前翼子板上装有一个摄像头;6-雷达(如果配备)安装在前保险杠后面。特斯拉车型销量形势良好,通过传感器件建立了庞大的数据库,但受限于硬件限制,无法充分挖掘数据价值,Dojo 量产有望突破瓶颈。

自建 AI 基础设施,AI 或赋能特斯拉快速成长。特斯拉 Dojo 性能强大,我们认为,除加速自身智驾进程外,或可拓展至其他应用领域,如机器人等。此外,特斯拉也可能成为一家云服务提供商,向相关厂商提供自身算力或模型服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2547

    文章

    50536

    浏览量

    751462
  • AI
    AI
    +关注

    关注

    87

    文章

    29946

    浏览量

    268245
  • 毫米波雷达
    +关注

    关注

    106

    文章

    1027

    浏览量

    64219

原文标题:Dojo对标A100性能强劲,AI应用场景拓展

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英伟达a100和h100哪个强?英伟达A100和H100的区别

    英伟达a100和h100哪个强? 就A100和H100这两个产品来说,它们虽然都是英伟达公司的高性能计算产品,但是面向的市场和应
    的头像 发表于 08-09 17:31 4.6w次阅读

    NanoEdge AI的技术原理、应用场景及优势

    能耗并提高数据安全性。本文将对 NanoEdge AI 的技术原理、应用场景以及优势进行综述。 1、技术原理 NanoEdge AI 的核心技术包括边缘计算、神经网络压缩和低功耗硬件设计。边缘计算
    发表于 03-12 08:09

    新一代AI ISP视频处理模组,对Hi3559A、Hi3519A平台性能

    照度全彩视频处理模组SOM928及配套的IVP928智能视频处理开发套件,对Hi3559A、Hi3519A平台性能;除了同样优秀的编解码能力外,更拥有关键的
    发表于 06-07 15:12

    NVIDIA推出了基于A100的DGX A100

    在发布A100 80GB加速卡之后,NVIDIA也更新了自家的DGX A100产品线,最多可达640GB HBM2e显存了。此外,还有全新的DGX Station A100工作站,配备了4个A
    的头像 发表于 11-17 10:26 4350次阅读

    英伟达a100和h100哪个强?

    英伟达a100和h100哪个强? 英伟达A100比H100更强。英伟达A100在处理大型模型和数据集时可能比V
    的头像 发表于 08-07 17:32 1.5w次阅读

    英伟达a100a800的区别

    的浮点性能为19.5 TFLOPS,而A800为10.6 TFLOPS。 3. 存储容量不同:A100的显存最大为80 GB,而A800为48 GB。 4.
    的头像 发表于 08-07 17:57 4.3w次阅读

    英伟达a100a800参数对比

    | | 尺寸(L x H) | 26.7 x 11.2 cm | 26.7 x 11.2 cm | | 适用领域 | AI、机器学习、高性能计算 | 虚拟桌面、虚拟应用、多媒体、游戏 | 总体而言,A100的核心数量
    的头像 发表于 08-07 18:00 1.3w次阅读
    英伟达<b class='flag-5'>a100</b>和<b class='flag-5'>a</b>800参数对比

    英伟达A100和3090的区别

    英伟达A100和3090的区别 英伟达A100是一款面向数据中心的计算加速器,其主要优势是支持数据中心最新的AI、机器学习和高性能计算工作负载。它配备了专门的张量核心和加速器,可以比普
    的头像 发表于 08-07 18:54 4199次阅读

    英伟达A100和4090的区别

    英伟达A100和4090的区别 英伟达A100和4090都是英伟达的高性能计算卡型号。它们之间的主要区别在于: 1. 架构:英伟达A100采用的是Ampere架构,而4090采用的是V
    的头像 发表于 08-08 11:59 3w次阅读

    英伟达A100是什么系列?

    被暴抢。 英伟达A100是英伟达推出的一款数据中心GPU系列,采用了全新的Ampere架构。它是一款专为深度学习、科学计算、超级计算等工作负载设计的高性能计算解决方案,拥有更高的计算能力、更大的显存容量和更快的数据传输速度等优势。 英伟达
    的头像 发表于 08-08 15:13 3029次阅读

    英伟达A100的简介

    A100是英伟达公司推出的一款面向高性能计算(HPC)和人工智能(AI)的加速计算卡。它采用了全球首个基于7nm工艺的数据中心GPU架构Ampere,拥有6912个CUDA核心和432个张量核心
    的头像 发表于 08-08 15:17 9034次阅读

    英伟达A100的优势分析

    HBM2显存。 英伟达A100是一款高性能的GPU,其主要优势如下: 1. 支持高效的AI计算:A100采用了新一代的Tensor Core技术,能够在
    的头像 发表于 08-08 15:25 3215次阅读

    英伟达a100有国产替代吗?

    和昇腾920芯片均具有AI处理能力。另外,国内企业紫光展锐、寒武纪等也在不断推出性能与英伟达A100相近的AI芯片。虽然目前这些芯片还无法完全替代英伟达
    的头像 发表于 08-08 15:37 4410次阅读

    英伟达v100A100的差距有哪些?

    英伟达v100A100的差距有哪些? 在当今人工智能和深度学习技术日益发展的时代,高性能计算机显卡已成为支持这些技术发展的关键。英伟达是高性能计算机显卡领域的领导者之一,其v
    的头像 发表于 08-22 16:46 2.2w次阅读

    英伟达H200和A100的区别

    英伟达H200和A100两款芯片在性能、架构、内存以及应用场景等多个方面存在显著的区别。
    的头像 发表于 03-07 16:23 3329次阅读