欲把AI计算成本打下来，谷歌高效益TPU正式开放-电子发烧友网

电子发烧友网报道（文/周凯扬）对于每个想要自己开发和部署AI模型的应用开发者来说，硬件和服务器支出都是一笔不小的费用。就以英伟达的GPU为例，即便是消费级的GPU，最近也迎来了一波涨价潮，更不用爆火的A100/H100等型号了。

即便是租赁服务器，基于这些热门硬件的服务器也远算不上便宜，因此不少云服务厂商为了进一步拉拢更多AI应用开发者，纷纷推出了性价比更高的选项。这些选项有的是基于CPU的AI计算服务器，有的是基于第三方AI加速器打造的服务器，还有的则是由云服务厂商基于自研加速器打造且独家提供的服务器。

谷歌高性价比TPU面世

谷歌在今年8月底发布了第五代的自研TPU，TPU v5e。谷歌称该加速器实现了性能与成本效益的平衡。相比上一代TPU v4，TPU V5e提供了同成本下两倍的训练性能，以及针对LLM和生成式AI模型2.5倍的推理性能。

TPU v5e架构

单个TPU v5e Pod由256个芯片互联，总带宽超过400Tb/s，INT8总算力达100petaOps。而且谷歌为TPU v5e采用了更灵活的配置选项，其支持8个不同的虚拟机配置，单个切片支持单芯片到250多个芯片，如此一来客户就可以根据自己的模型大小来选择合适的配置。

而且过去借助谷歌TPU进行的训练负载只局限于单个切片中，谷歌为此开发了Multislice技术，可通过芯片间互联以及数据中心网络中的多个TPU Pod相连，从而将训练工作扩展到数万个芯片上。

为了进一步扩大对开发生态的支持，TPU v5e还内置了对JAX、Pytorch和Tensorflow等领先AI框架，以及 Hugging Face 的 Transformers 和 Accelerate、PyTorch Lightning 和 Ray等一系列常用开源工具的支持。

开放使用与自用

近日，谷歌终于宣布TPU v5e进入公用阶段，且在最新的MLPerf训练3.1测试中，TPUv5e获得了更好的表现。在该测试中，谷歌改进了创新的混合精度训练算法，除了原生支持的BF16外，还用到了INT8精度格式。这意味着客户在提高了模型准确性的同时，将花费更少的成本。

从谷歌云对于TPU v5e的定价表来看，v5e在成本效益上确实有着极大的优势。不过需要注意的是，v5e与v2、v3 Pod类似，每个芯片中只有一个TensorCore，而v4 Pod的每个芯片中有两个TensorCore。这也是为何v5e的单芯片峰值算力为197TFLOPS，而v4的单芯片峰值算力为275TFLOPS，可即便如此，在按芯片小时的定价下，其所需成本依然低于v4。

在如此高的性价比下，谷歌不仅将TPU提供给外部开发者使用，其内部一些开发项目也开始用上TPU v5e。比如其PaLM模型的创建，就用到了上文提到的Multislice技术，谷歌的Bard团队同样在用TPU v5e训练这一生成式AI聊天机器人。

写在最后

其实在TPUv5e开放使用之前，谷歌也正式开放了A3 VM这类GPU加速虚拟机的使用。这也是多数云服务厂商采用的多方案供应策略，其自研加速器只需要为客户提供一个高性价比的方案，而追求更高性能的客户，依然可以选择基于H100 GPU打造的服务器。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31845

浏览量
270676

把SiC价格打下来！两年内拟降30%，市场加速渗透

过去，SiC的晶体生长速度慢、良率低，导致生产成本较高，一直限制了SiC的普及。不过在近期据媒体报道，有业内人士预计，未来两年SiC芯片价格将下降达30%，原因在于越来越多的本地厂商开始获得电动汽车认证并扩大了其制造能力。SiC芯片将

发表于 08-03 00:59 •4592次阅读

传DeepSeek自研芯片，厂商们要把AI成本打下来

外购芯片的成本，掌握供应链主动权，另一方面随着AI推理应用的爆发，AI推理芯片有机会被重新定义。 DeepSeek 不完全依赖英伟达去年12月底发布的DeepSeek-V3模型，整个训练使用2048块英伟达H800 G

发表于 02-16 00:09 •633次阅读

传DeepSeek自研芯片，厂商们要把<b class='flag-5'>AI</b><b class='flag-5'>成本</b><b class='flag-5'>打下来</b>

谷歌加速AI部门整合：AI Studio团队并入DeepMind

近日，谷歌正紧锣密鼓地推进其人工智能(AI)部门的整合工作。据谷歌AI Studio主管Logan Kilpatrick在领英页面上的透露，谷歌

发表于 01-13 14:40 •291次阅读

AI云端计算资源的多维度优势

AI云端计算资源，作为AI技术与云计算深度融合的产物，在成本效益、性能优化、数据安全、灵活扩展以

发表于 01-07 11:11 •125次阅读

低成本高效益 | 自连医疗设备无线化改造实例汇集

原文标题：低成本高效益 | 自连医疗设备无线化改造实例汇集文章出处：【微信公

发表于 10-24 17:25 •282次阅读

谷歌发布革命性AI游戏引擎GameNGen

谷歌近期震撼推出全球首款完全由人工智能驱动的游戏引擎——GameNGen，这一创新技术标志着游戏开发领域的新纪元。GameNGen凭借其强大的计算能力，能够在单个TPU上实现每秒20帧的实时游戏生成，每一帧画面均源自精密的扩散模

发表于 08-29 18:07 •937次阅读

从TPU v1到Trillium TPU，苹果等科技公司使用谷歌TPU进行AI计算

，在训练尖端人工智能方面，大型科技公司正在寻找英伟达以外的替代品。不断迭代的谷歌TPU 芯片随着机器学习算法，特别是深度学习算法在各个领域的广泛应用，对于高效、低功耗的AI

发表于 07-31 01:08 •3464次阅读

谷歌发布新一代TPU芯片，欲挑战OpenAI，挑战语音助手市场

当日，谷歌在年度I/O开发者大会上展示了一系列人工智能产品，包括新增的旗舰级Gemini AI模型Gemini 1.5 Flash以及AI搜索引擎等，进一步巩固了其在网络搜索领域的领先地位。

发表于 05-17 09:36 •491次阅读

谷歌推出Trillium AI芯片，性能提高近5倍

谷歌推出了其最新的人工智能数据中心芯片——Trillium。这款芯片是谷歌的第六代产品，与上一代TPU v5e相比，Trillium在每个芯片上的峰值计算性能提高了4.7倍，节能67%

发表于 05-16 10:39 •839次阅读

谷歌推新AI音乐工具，发布第六代TPU芯片

谷歌近日宣布与YouTube合作，推出全新音乐工具Music AI Sandbox。这款AI音乐创作工具将与传统AI音乐应用如Suno等展开竞争，为用户提供更多元化的音乐创作体验。

发表于 05-16 09:44 •439次阅读

谷歌将推出第六代数据中心AI芯片Trillium TPU

在今日举行的I/O 2024开发者大会上，谷歌公司震撼发布了其第六代数据中心AI芯片——Trillium Tensor处理器单元（TPU）。据谷歌首席执行官皮查伊透露，这款新型

发表于 05-15 11:18 •694次阅读

risc-v多核芯片在AI方面的应用

应用中的成本。最后，RISC-V多核芯片不仅可以应用于AI边缘计算领域，还可以扩展到其他领域，如数据中心、云计算、自动驾驶、机器人等，为这些领域提供

发表于 04-28 09:20

谷歌AI大模型Gemma全球开放使用

谷歌公司近日宣布，其全新的AI大模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌在AI领域的领先地位，还为其在全球范围内的

发表于 02-28 18:12 •1246次阅读

Groq推出大模型推理芯片超越了传统GPU和谷歌TPU

Groq推出了大模型推理芯片，以每秒500tokens的速度引起轰动，超越了传统GPU和谷歌TPU。

发表于 02-26 10:24 •1266次阅读

谷歌宣布Gemma大模型全球开放使用

谷歌公司近日宣布，其先进的AI大模型Gemma即日起在全球范围内开放使用。这一新模型由谷歌DeepMind和其他团队合作开发，并与其最大的AI

发表于 02-23 10:41 •845次阅读

搜索历史

欲把AI计算成本打下来，谷歌高效益TPU正式开放

评论

把SiC价格打下来！两年内拟降30%，市场加速渗透

传DeepSeek自研芯片，厂商们要把AI成本打下来

谷歌加速AI部门整合：AI Studio团队并入DeepMind

AI云端计算资源的多维度优势

低成本高效益 | 自连医疗设备无线化改造实例汇集

谷歌发布革命性AI游戏引擎GameNGen

从TPU v1到Trillium TPU，苹果等科技公司使用谷歌TPU进行AI计算

谷歌发布新一代TPU芯片，欲挑战OpenAI，挑战语音助手市场

谷歌推出Trillium AI芯片，性能提高近5倍

谷歌推新AI音乐工具，发布第六代TPU芯片

谷歌将推出第六代数据中心AI芯片Trillium TPU

risc-v多核芯片在AI方面的应用

谷歌AI大模型Gemma全球开放使用

Groq推出大模型推理芯片超越了传统GPU和谷歌TPU

谷歌宣布Gemma大模型全球开放使用