0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

欲把AI计算成本打下来,谷歌高效益TPU正式开放

E4Life 来源:电子发烧友网 作者:周凯扬 2023-11-14 00:18 次阅读

电子发烧友网报道(文/周凯扬)对于每个想要自己开发和部署AI模型的应用开发者来说,硬件和服务器支出都是一笔不小的费用。就以英伟达GPU为例,即便是消费级的GPU,最近也迎来了一波涨价潮,更不用爆火的A100/H100等型号了。

即便是租赁服务器,基于这些热门硬件的服务器也远算不上便宜,因此不少云服务厂商为了进一步拉拢更多AI应用开发者,纷纷推出了性价比更高的选项。这些选项有的是基于CPU的AI计算服务器,有的是基于第三方AI加速器打造的服务器,还有的则是由云服务厂商基于自研加速器打造且独家提供的服务器。

谷歌高性价比TPU面世

谷歌在今年8月底发布了第五代的自研TPU,TPU v5e。谷歌称该加速器实现了性能与成本效益的平衡。相比上一代TPU v4,TPU V5e提供了同成本下两倍的训练性能,以及针对LLM和生成式AI模型2.5倍的推理性能。

wKgaomVR-HqAJvSzAABXKc7C2hk445.png
TPU v5e架构


单个TPU v5e Pod由256个芯片互联,总带宽超过400Tb/s,INT8总算力达100petaOps。而且谷歌为TPU v5e采用了更灵活的配置选项,其支持8个不同的虚拟机配置,单个切片支持单芯片到250多个芯片,如此一来客户就可以根据自己的模型大小来选择合适的配置。

而且过去借助谷歌TPU进行的训练负载只局限于单个切片中,谷歌为此开发了Multislice技术,可通过芯片间互联以及数据中心网络中的多个TPU Pod相连,从而将训练工作扩展到数万个芯片上。

为了进一步扩大对开发生态的支持,TPU v5e还内置了对JAX、Pytorch和Tensorflow等领先AI框架,以及 Hugging Face 的 TransformersAccelerate、PyTorch Lightning 和 Ray等一系列常用开源工具的支持。

开放使用与自用

近日,谷歌终于宣布TPU v5e进入公用阶段,且在最新的MLPerf训练3.1测试中,TPUv5e获得了更好的表现。在该测试中,谷歌改进了创新的混合精度训练算法,除了原生支持的BF16外,还用到了INT8精度格式。这意味着客户在提高了模型准确性的同时,将花费更少的成本。

wKgZomVR-IOANSMPAAIyMIzn61I221.png
从谷歌云对于TPU v5e的定价表来看,v5e在成本效益上确实有着极大的优势。不过需要注意的是,v5e与v2、v3 Pod类似,每个芯片中只有一个TensorCore,而v4 Pod的每个芯片中有两个TensorCore。这也是为何v5e的单芯片峰值算力为197TFLOPS,而v4的单芯片峰值算力为275TFLOPS,可即便如此,在按芯片小时的定价下,其所需成本依然低于v4。

在如此高的性价比下,谷歌不仅将TPU提供给外部开发者使用,其内部一些开发项目也开始用上TPU v5e。比如其PaLM模型的创建,就用到了上文提到的Multislice技术,谷歌的Bard团队同样在用TPU v5e训练这一生成式AI聊天机器人

写在最后

其实在TPUv5e开放使用之前,谷歌也正式开放了A3 VM这类GPU加速虚拟机的使用。这也是多数云服务厂商采用的多方案供应策略,其自研加速器只需要为客户提供一个高性价比的方案,而追求更高性能的客户,依然可以选择基于H100 GPU打造的服务器。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268887
收藏 人收藏

    评论

    相关推荐

    SiC价格打下来!两年内拟降30%,市场加速渗透

    过去,SiC的晶体生长速度慢、良率低,导致生产成本较高,一直限制了SiC的普及。   不过在近期据媒体报道,有业内人士预计,未来两年SiC芯片价格将下降达30%,原因在于越来越多的本地厂商开始获得电动汽车认证并扩大了其制造能力。SiC芯片将
    的头像 发表于 08-03 00:59 4453次阅读

    成本高效益 | 自连医疗设备无线化改造实例汇集

    原文标题:低成本高效益 | 自连医疗设备无线化改造实例汇集 文章出处:【微信公
    的头像 发表于 10-24 17:25 160次阅读

    谷歌发布革命性AI游戏引擎GameNGen

    谷歌近期震撼推出全球首款完全由人工智能驱动的游戏引擎——GameNGen,这一创新技术标志着游戏开发领域的新纪元。GameNGen凭借其强大的计算能力,能够在单个TPU上实现每秒20帧的实时游戏生成,每一帧画面均源自精密的扩散模
    的头像 发表于 08-29 18:07 880次阅读

    TPU v1到Trillium TPU,苹果等科技公司使用谷歌TPU进行AI计算

    ,在训练尖端人工智能方面,大型科技公司正在寻找英伟达以外的替代品。   不断迭代的谷歌TPU 芯片   随着机器学习算法,特别是深度学习算法在各个领域的广泛应用,对于高效、低功耗的AI
    的头像 发表于 07-31 01:08 3354次阅读

    价格打下来了,只要9.9万,人形机器人的春天来了吗?

    不久前,国内机器人公司宇树科技在其官方公众号推送了一篇名为《UnitreeG1人形智能体AI化身¥9.9万元起》的文章,宣布其推出了一款9.9万的人形智能机器人。十万不到的价格,瞬间让人有一种科幻
    的头像 发表于 05-25 08:05 448次阅读
    价格<b class='flag-5'>打下来</b>了,只要9.9万,人形机器人的春天来了吗?

    谷歌发布新一代TPU芯片,挑战OpenAI,挑战语音助手市场

    当日,谷歌在年度I/O开发者大会上展示了一系列人工智能产品,包括新增的旗舰级Gemini AI模型Gemini 1.5 Flash以及AI搜索引擎等,进一步巩固了其在网络搜索领域的领先地位。
    的头像 发表于 05-17 09:36 435次阅读

    谷歌推出Trillium AI芯片,性能提高近5倍

    谷歌推出了其最新的人工智能数据中心芯片——Trillium。这款芯片是谷歌的第六代产品,与上一代TPU v5e相比,Trillium在每个芯片上的峰值计算性能提高了4.7倍,节能67%
    的头像 发表于 05-16 10:39 768次阅读

    谷歌推新AI音乐工具,发布第六代TPU芯片

    谷歌近日宣布与YouTube合作,推出全新音乐工具Music AI Sandbox。这款AI音乐创作工具将与传统AI音乐应用如Suno等展开竞争,为用户提供更多元化的音乐创作体验。
    的头像 发表于 05-16 09:44 385次阅读

    谷歌将推出第六代数据中心AI芯片Trillium TPU

    在今日举行的I/O 2024开发者大会上,谷歌公司震撼发布了其第六代数据中心AI芯片——Trillium Tensor处理器单元(TPU)。据谷歌首席执行官皮查伊透露,这款新型
    的头像 发表于 05-15 11:18 622次阅读

    risc-v多核芯片在AI方面的应用

    应用中的成本。 最后,RISC-V多核芯片不仅可以应用于AI边缘计算领域,还可以扩展到其他领域,如数据中心、云计算、自动驾驶、机器人等,为这些领域提供
    发表于 04-28 09:20

    谷歌AI大模型Gemma全球开放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌AI领域的领先地位,还为其在全球范围内的
    的头像 发表于 02-28 18:12 1136次阅读

    Groq推出大模型推理芯片 超越了传统GPU和谷歌TPU

    Groq推出了大模型推理芯片,以每秒500tokens的速度引起轰动,超越了传统GPU和谷歌TPU
    的头像 发表于 02-26 10:24 1029次阅读
    Groq推出大模型推理芯片 超越了传统GPU和<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b>

    谷歌宣布Gemma大模型全球开放使用

    谷歌公司近日宣布,其先进的AI大模型Gemma即日起在全球范围内开放使用。这一新模型由谷歌DeepMind和其他团队合作开发,并与其最大的AI
    的头像 发表于 02-23 10:41 770次阅读

    谷歌TPU v5p超越Nvidia H100,成为人工智能领域的竞争对手

    TPU v5p已在谷歌AI超级计算机”项目中发挥重要作用,这并非专业科研型超算平台,而是面向各类人工智能应用。与Nvidia开放GPU购买
    的头像 发表于 12-26 15:20 2317次阅读

    谷歌最强大的定制设计人工智能加速器—TPU v5p芯片

    谷歌正迅速成为 BFF Nvidia 的强大对手——为其超级计算机提供动力的 TPU v5p AI 芯片速度更快,内存和带宽比以往任何时候都多,甚至击败了强大的 H100
    的头像 发表于 12-26 09:31 1893次阅读