电子发烧友网报道(文/周凯扬)对于每个想要自己开发和部署AI模型的应用开发者来说,硬件和服务器支出都是一笔不小的费用。就以英伟达的GPU为例,即便是消费级的GPU,最近也迎来了一波涨价潮,更不用爆火的A100/H100等型号了。
即便是租赁服务器,基于这些热门硬件的服务器也远算不上便宜,因此不少云服务厂商为了进一步拉拢更多AI应用开发者,纷纷推出了性价比更高的选项。这些选项有的是基于CPU的AI计算服务器,有的是基于第三方AI加速器打造的服务器,还有的则是由云服务厂商基于自研加速器打造且独家提供的服务器。
谷歌高性价比TPU面世
谷歌在今年8月底发布了第五代的自研TPU,TPU v5e。谷歌称该加速器实现了性能与成本效益的平衡。相比上一代TPU v4,TPU V5e提供了同成本下两倍的训练性能,以及针对LLM和生成式AI模型2.5倍的推理性能。
TPU v5e架构
单个TPU v5e Pod由256个芯片互联,总带宽超过400Tb/s,INT8总算力达100petaOps。而且谷歌为TPU v5e采用了更灵活的配置选项,其支持8个不同的虚拟机配置,单个切片支持单芯片到250多个芯片,如此一来客户就可以根据自己的模型大小来选择合适的配置。
而且过去借助谷歌TPU进行的训练负载只局限于单个切片中,谷歌为此开发了Multislice技术,可通过芯片间互联以及数据中心网络中的多个TPU Pod相连,从而将训练工作扩展到数万个芯片上。
为了进一步扩大对开发生态的支持,TPU v5e还内置了对JAX、Pytorch和Tensorflow等领先AI框架,以及 Hugging Face 的 Transformers 和 Accelerate、PyTorch Lightning 和 Ray等一系列常用开源工具的支持。
开放使用与自用
近日,谷歌终于宣布TPU v5e进入公用阶段,且在最新的MLPerf训练3.1测试中,TPUv5e获得了更好的表现。在该测试中,谷歌改进了创新的混合精度训练算法,除了原生支持的BF16外,还用到了INT8精度格式。这意味着客户在提高了模型准确性的同时,将花费更少的成本。
从谷歌云对于TPU v5e的定价表来看,v5e在成本效益上确实有着极大的优势。不过需要注意的是,v5e与v2、v3 Pod类似,每个芯片中只有一个TensorCore,而v4 Pod的每个芯片中有两个TensorCore。这也是为何v5e的单芯片峰值算力为197TFLOPS,而v4的单芯片峰值算力为275TFLOPS,可即便如此,在按芯片小时的定价下,其所需成本依然低于v4。
在如此高的性价比下,谷歌不仅将TPU提供给外部开发者使用,其内部一些开发项目也开始用上TPU v5e。比如其PaLM模型的创建,就用到了上文提到的Multislice技术,谷歌的Bard团队同样在用TPU v5e训练这一生成式AI聊天机器人。
写在最后
其实在TPUv5e开放使用之前,谷歌也正式开放了A3 VM这类GPU加速虚拟机的使用。这也是多数云服务厂商采用的多方案供应策略,其自研加速器只需要为客户提供一个高性价比的方案,而追求更高性能的客户,依然可以选择基于H100 GPU打造的服务器。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
相关推荐
过去,SiC的晶体生长速度慢、良率低,导致生产成本较高,一直限制了SiC的普及。 不过在近期据媒体报道,有业内人士预计,未来两年SiC芯片价格将下降达30%,原因在于越来越多的本地厂商开始获得电动汽车认证并扩大了其制造能力。SiC芯片将
发表于 08-03 00:59
•4453次阅读
原文标题:低成本高效益 | 自连医疗设备无线化改造实例汇集
文章出处:【微信公
发表于 10-24 17:25
•160次阅读
谷歌近期震撼推出全球首款完全由人工智能驱动的游戏引擎——GameNGen,这一创新技术标志着游戏开发领域的新纪元。GameNGen凭借其强大的计算能力,能够在单个TPU上实现每秒20帧的实时游戏生成,每一帧画面均源自精密的扩散模
发表于 08-29 18:07
•880次阅读
,在训练尖端人工智能方面,大型科技公司正在寻找英伟达以外的替代品。 不断迭代的谷歌TPU 芯片 随着机器学习算法,特别是深度学习算法在各个领域的广泛应用,对于高效、低功耗的AI
发表于 07-31 01:08
•3354次阅读
不久前,国内机器人公司宇树科技在其官方公众号推送了一篇名为《UnitreeG1人形智能体AI化身¥9.9万元起》的文章,宣布其推出了一款9.9万的人形智能机器人。十万不到的价格,瞬间让人有一种科幻
发表于 05-25 08:05
•448次阅读
当日,谷歌在年度I/O开发者大会上展示了一系列人工智能产品,包括新增的旗舰级Gemini AI模型Gemini 1.5 Flash以及AI搜索引擎等,进一步巩固了其在网络搜索领域的领先地位。
发表于 05-17 09:36
•435次阅读
谷歌推出了其最新的人工智能数据中心芯片——Trillium。这款芯片是谷歌的第六代产品,与上一代TPU v5e相比,Trillium在每个芯片上的峰值计算性能提高了4.7倍,节能67%
发表于 05-16 10:39
•768次阅读
谷歌近日宣布与YouTube合作,推出全新音乐工具Music AI Sandbox。这款AI音乐创作工具将与传统AI音乐应用如Suno等展开竞争,为用户提供更多元化的音乐创作体验。
发表于 05-16 09:44
•385次阅读
在今日举行的I/O 2024开发者大会上,谷歌公司震撼发布了其第六代数据中心AI芯片——Trillium Tensor处理器单元(TPU)。据谷歌首席执行官皮查伊透露,这款新型
发表于 05-15 11:18
•622次阅读
应用中的成本。
最后,RISC-V多核芯片不仅可以应用于AI边缘计算领域,还可以扩展到其他领域,如数据中心、云计算、自动驾驶、机器人等,为这些领域提供
发表于 04-28 09:20
谷歌公司近日宣布,其全新的AI大模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌在AI领域的领先地位,还为其在全球范围内的
发表于 02-28 18:12
•1136次阅读
Groq推出了大模型推理芯片,以每秒500tokens的速度引起轰动,超越了传统GPU和谷歌TPU。
发表于 02-26 10:24
•1029次阅读
谷歌公司近日宣布,其先进的AI大模型Gemma即日起在全球范围内开放使用。这一新模型由谷歌DeepMind和其他团队合作开发,并与其最大的AI
发表于 02-23 10:41
•770次阅读
TPU v5p已在谷歌“AI超级计算机”项目中发挥重要作用,这并非专业科研型超算平台,而是面向各类人工智能应用。与Nvidia开放GPU购买
发表于 12-26 15:20
•2317次阅读
谷歌正迅速成为 BFF Nvidia 的强大对手——为其超级计算机提供动力的 TPU v5p AI 芯片速度更快,内存和带宽比以往任何时候都多,甚至击败了强大的 H100
发表于 12-26 09:31
•1893次阅读
评论